Tutorial on Technical Issues towards Ethical Data - - PowerPoint PPT Presentation

tutorial on technical issues towards ethical data
SMART_READER_LITE
LIVE PREVIEW

Tutorial on Technical Issues towards Ethical Data - - PowerPoint PPT Presentation

Tutorial on Technical Issues towards Ethical Data Management Serge Abiteboul Some of it jointly with Julia Stoyanovich Data out there 4/14/16


slide-1
SLIDE 1

Tutorial ¡on ¡ Technical ¡Issues ¡towards ¡ Ethical ¡Data ¡Management ¡

¡ Serge ¡Abiteboul ¡ ¡ Some ¡of ¡it ¡jointly ¡with ¡Julia ¡ Stoyanovich ¡

slide-2
SLIDE 2

Data ¡out ¡there ¡

Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 2 ¡ 4/14/16 ¡

slide-3
SLIDE 3

Data ¡is ¡exploding ¡ ¡

Personal ¡data ¡

– Data ¡and ¡metadata ¡we ¡produce ¡ – Data ¡others ¡(friends ¡or ¡not…) ¡produce ¡about ¡us ¡ – Data ¡sensors ¡produce ¡about ¡us ¡ – Data ¡programs ¡produce ¡about ¡us ¡

Web ¡data ¡in ¡general ¡

  • 4V: ¡Volume, ¡veracity, ¡velocity, ¡variety ¡

Individuals ¡and ¡the ¡society ¡are ¡losing ¡control ¡over ¡ all ¡this ¡data ¡ ¡

3 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 4/14/16 ¡

slide-4
SLIDE 4

Promises ¡and ¡risks ¡of ¡massive ¡data ¡

  • Improve ¡people’s ¡lives, ¡e.g., ¡

recommendaSon ¡

  • Accelerate ¡scienSfic ¡discovery, ¡

e.g., ¡medicine ¡

  • Boost ¡ ¡innovaSon, ¡e.g., ¡

autonomous ¡cars ¡

  • Transform ¡society, ¡e.g., ¡open ¡

government ¡

  • OpSmize ¡business, ¡e.g., ¡

adverSsement ¡targeSng ¡ Growing ¡resentment ¡ ¡

  • Against ¡bad ¡behaviors: ¡racism, ¡

terrorist ¡sites, ¡pedophilia, ¡idenSty ¡ theY, ¡cyberbullying, ¡cybercrime ¡

  • Against ¡companies: ¡intrusive ¡

markeSng, ¡crypSc ¡personalizaSon ¡ and ¡business ¡decisions ¡ ¡

  • Against ¡governments: ¡NSA ¡and ¡its ¡

European ¡counterparts ¡ Increasing ¡awareness ¡of ¡the ¡ dissymmetry ¡between ¡what ¡ these ¡systems ¡know ¡about ¡a ¡ person, ¡and ¡what ¡the ¡person ¡ actually ¡knows ¡ ¡

4 ¡ 4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-5
SLIDE 5

MoSvaSon ¡

An ¡opinion ¡ ¡

– in ¡the ¡past: ¡data ¡model ¡& ¡performance ¡ – now: ¡personal/social ¡data ¡& ¡ethics ¡ – Proof: ¡We ¡have ¡the ¡data ¡models ¡and ¡the ¡ performance ¡and ¡many ¡societal ¡issues ¡today ¡are ¡ related ¡to ¡data ¡

What ¡should ¡be ¡done ¡

– Time ¡to ¡change ¡how ¡we ¡deal ¡with ¡personal ¡data? ¡ – Time ¡to ¡change ¡the ¡web? ¡ ¡

¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 5 ¡

slide-6
SLIDE 6

References ¡

  • Data ¡responsibly, ¡with ¡Julia ¡Stoyanovich ¡(Drexel) ¡& ¡

Gerome ¡Miklau ¡(U. ¡Mass), ¡EDBT ¡Tutorial ¡2016 ¡

  • Data ¡responsibly, ¡with ¡Julia ¡Stoyanovich ¡(Drexel), ¡Sigmod ¡

Blog ¡(in ¡French, ¡Le ¡Monde), ¡2016 ¡

  • Managing ¡your ¡digital ¡life ¡with ¡a ¡Personal ¡informa8on ¡

management ¡system, ¡ ¡with ¡Benjamin ¡André ¡(Cozy ¡Cloud) ¡ & ¡Daniel ¡Kaplan ¡(Fing), ¡CACM ¡2015 ¡

  • Personal ¡informaSon ¡management ¡systems, ¡with ¡Amélie ¡

Marian ¡(Rutgers), ¡EDBT ¡Tutorial ¡2015 ¡

  • Pla9orm ¡Neutrality, ¡CNNum ¡Report, ¡2015 ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 6 ¡

slide-7
SLIDE 7

OrganizaSon ¡

ü MoSvaSon ¡

  • Privacy ¡
  • Data ¡analysis ¡
  • Data ¡quality ¡evaluaSon ¡
  • Data ¡disseminaSon ¡
  • Data ¡memory ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 7 ¡

slide-8
SLIDE 8

PRIVACY ¡

  • 1. Data ¡privacy ¡
  • 2. The ¡PIMS ¡

¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 8 ¡

slide-9
SLIDE 9

Data ¡privacy ¡

  • More ¡and ¡more ¡concerns ¡privacy ¡
  • LimitaSons ¡on ¡what ¡data ¡companies ¡can ¡do ¡

– Laws ¡to ¡force ¡companies ¡to ¡request ¡authorizaSon ¡to ¡build ¡ a ¡DB ¡with ¡of ¡personal ¡informaSon ¡(France) ¡

  • Rules ¡about ¡what ¡users ¡should ¡be ¡able ¡to ¡do ¡

– Laws ¡that ¡compel ¡companies ¡(e.g., ¡credit ¡reporSng ¡ agencies) ¡to ¡let ¡users ¡see ¡and ¡correct ¡informaSon ¡about ¡ them ¡(US) ¡

  • Laws ¡in ¡Europe, ¡US… ¡

– The ¡laws ¡depend ¡on ¡the ¡country ¡ – Their ¡enforcement ¡is ¡difficult ¡

  • Is ¡the ¡soluSon ¡disconnect? ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 9 ¡

slide-10
SLIDE 10

Data ¡privacy: ¡usability ¡

  • There ¡are ¡means ¡to ¡protect ¡data ¡but ¡people ¡
  • Yen ¡don’t ¡use ¡them ¡because ¡too ¡complicated ¡

and/or ¡not ¡understandable ¡

– Tools ¡for ¡cryptography ¡ – Access ¡rights ¡ – Unreadable ¡EULA ¡ ¡

  • End-­‑User ¡license ¡agreement ¡

– Difficulty ¡to ¡change ¡service ¡ ¡ ¡

  • Vendor ¡lock ¡in ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 10 ¡

slide-11
SLIDE 11

Research ¡issues ¡

  • Easier ¡to ¡use ¡tools ¡
  • AutomaSc ¡specificaSon ¡ ¡
  • Portability… ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 11 ¡

slide-12
SLIDE 12

Data ¡protecSon: ¡The ¡PIMS ¡

Many ¡Web ¡services ¡ Each ¡one ¡running ¡

  • On ¡some ¡unknown ¡

machines ¡

  • With ¡your ¡data ¡
  • Some ¡soYware ¡

¡ Your ¡PIMS ¡ ¡

  • Your ¡machine ¡
  • With ¡your ¡data ¡ ¡

– possibly ¡replica ¡of ¡data ¡from ¡ ¡ systems ¡you ¡like ¡

  • On ¡your ¡soYware ¡or ¡
  • Wrappers ¡to ¡external ¡

services ¡

A ¡Personal ¡Informa-on ¡Management ¡ System ¡is ¡a ¡cloud ¡system ¡that ¡manages ¡all ¡ the ¡informa8on ¡of ¡a ¡person ¡

¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 12 ¡

slide-13
SLIDE 13

It’s ¡first ¡about ¡data ¡integraSon ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 13 ¡

m ¡ i ¡ m ¡ i ¡ l u l u ¡ z a z a ¡

localizaSon ¡ webSearch ¡

calendar ¡ mail ¡ contacts ¡ facebook ¡

tripadvisor ¡

banks ¡ whatsap ¡

Facebook ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡IntegraSon ¡of ¡the ¡users ¡of ¡a ¡service ¡ IntegraSon ¡of ¡the ¡services ¡

  • f ¡a ¡user ¡

A ¡ L ¡ I ¡ C ¡ E ¡ ¡ ¡ X ¡ X ¡ X ¡ X ¡ X ¡ X ¡ X ¡ X ¡ X ¡

slide-14
SLIDE 14

Many ¡R&D ¡issues ¡

Old ¡problems ¡revisited ¡ ¡

  • Personal ¡informaSon ¡integraSon ¡ ¡
  • PersonalizaSon ¡and ¡context ¡awareness ¡
  • Personal ¡data ¡analysis ¡ ¡
  • Epsilon-­‑principle ¡(epsilon-­‑user-­‑administraSon) ¡
  • SynchronizaSon/backups ¡& ¡Task ¡sequencing ¡ ¡
  • Access ¡control ¡& ¡Exchange ¡of ¡informaSon ¡
  • Security ¡(e.g. ¡works ¡@ ¡INRIA ¡Rocquencourt) ¡
  • Connected ¡objects ¡control ¡

Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 14 ¡ 4/14/16 ¡

slide-15
SLIDE 15

DATA ¡ANALYSIS ¡

  • 1. Fairness ¡
  • 2. Transparency ¡
  • 3. Diversity ¡ ¡
  • 4. Privacy ¡

¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 15 ¡

slide-16
SLIDE 16

Gemng ¡knowledge ¡out ¡of ¡data ¡

  • Finding ¡ ¡staSsScal ¡correlaSons ¡
  • Publishing ¡aggregate ¡staSsScs ¡
  • DetecSng ¡outliers ¡
  • DetecSng ¡trends ¡ ¡
  • Number ¡of ¡techniques: ¡data ¡mining, ¡big ¡data, ¡

machine ¡learning ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 16 ¡

slide-17
SLIDE 17

¡ ¡ ¡ ¡ ¡ ¡ ¡Data ¡analysis: ¡Fairness ¡

  • Origins ¡of ¡bias ¡

– data ¡collecSon ¡

  • E.g., ¡a ¡crime ¡dataset ¡in ¡which ¡some ¡ciSes ¡are ¡under-­‑represented ¡

– data ¡analysis ¡ ¡

  • E.g., ¡a ¡search ¡engine ¡that ¡skews ¡recommendaSons ¡in ¡favor ¡of ¡adverSsing ¡

customers ¡

  • This ¡bias ¡may ¡even ¡be ¡illegal ¡

– Offer ¡less ¡advantageous ¡financial ¡products ¡to ¡members ¡of ¡minority ¡ groups ¡(a ¡pracSce ¡known ¡as ¡steering) ¡

  • Example: ¡analysis ¡of ¡scienSfic ¡data ¡

– Should ¡explain ¡how ¡data ¡was ¡obtained ¡ – Should ¡explain ¡which ¡analysis ¡was ¡carried ¡on ¡it ¡ – Experiments ¡should ¡be ¡reproducible ¡

Very ¡studied ¡already ¡– ¡lots ¡of ¡research ¡issues ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 17 ¡

slide-18
SLIDE 18

Effect ¡on ¡sub-­‑populaSons ¡

18 ¡

grad ¡school ¡admissions ¡ admiHed ¡ denied ¡ F ¡ 1512 ¡ 2809 ¡ M ¡ 3715 ¡ 4727 ¡

gender ¡

posiJve ¡ ¡

  • utcomes ¡

35%

  • f women

44%

  • f men

UC Berkeley 1973: women applied to more competitive departments, with low rates of admission among qualified applicants. Simpson’s ¡paradox ¡ disparate impact at the full population level disappears or reverses when looking at sub-populations!

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-19
SLIDE 19

Group ¡versus ¡individual ¡fairness ¡

19 ¡

Group ¡fairness ¡ demographics of the individuals receiving any outcome are the same as demographics of the underlying population

credit ¡score ¡ good ¡ bad ¡ black ¡ white ¡

⊕ ⊖ ⊖ ⊖ ⊕ ⊕ ⊖ ⊖ ⊖ ⊕

posiJve ¡ ¡

  • utcomes ¡

40%

  • f black

40%

  • f white

race ¡

Individual ¡fairness ¡ any two individuals who are similar w.r.t. a particular task should receive similar outcomes

  • ffered ¡

credit ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-20
SLIDE 20

¡ ¡ ¡ ¡ ¡ ¡ ¡Data ¡analysis: ¡Diversity ¡

  • Relevance ¡ranking ¡(for ¡recommendaSon) ¡ ¡

¡is ¡typically ¡based ¡on ¡popularity ¡

– Ignores ¡less ¡common ¡informaSon ¡(in ¡the ¡tail) ¡that ¡consStutes ¡in ¡fact ¡ the ¡overwhelming ¡majority ¡ – Lack ¡of ¡diversity ¡can ¡lead ¡to ¡discriminaSon, ¡exclusion. ¡ ¡

  • Examples ¡

– on-­‑line ¡daSng ¡plaporm ¡like ¡Match.com ¡ – a ¡crowdsourcing ¡marketplace ¡like ¡Amazon ¡Mechanical ¡Turk ¡ – or ¡a ¡funding ¡plaporm ¡like ¡Kickstarter ¡

The rich get richer, the poor get poorer ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 20 ¡

slide-21
SLIDE 21

Rank-­‑aware ¡clustering ¡

Return clusters that expose best fr best from

  • m

among comparable among comparable items (profiles) w.r.t. user preferences

21 ¡

[J. ¡Stoyanovich, ¡S. ¡Amer-­‑Yahia, ¡T. ¡Milo; ¡EDBT ¡2011] ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-22
SLIDE 22

¡Data ¡analysis: ¡Transparency ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡

  • Example: ¡lack ¡of ¡transparency ¡in ¡Facebook ¡data ¡

processing ¡

– In ¡general, ¡unreadable ¡End-­‑user ¡license ¡agreement ¡

  • Users ¡want ¡to ¡control ¡what ¡is ¡recorded ¡about ¡

them, ¡and ¡how ¡that ¡informaSon ¡is ¡used ¡

  • Transparency ¡facilitates ¡verificaSon ¡that ¡a ¡service ¡

performs ¡as ¡it ¡should, ¡as ¡is ¡promised ¡

  • Also ¡allows ¡a ¡data ¡provider ¡to ¡verify ¡that ¡data ¡are ¡

well ¡used ¡as ¡it ¡has ¡specified. ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 22 ¡

slide-23
SLIDE 23

¡ ¡ ¡ ¡ ¡ ¡Privacy ¡in ¡data ¡analysis ¡

  • When ¡publishing ¡

staSsScs, ¡ ¡ ¡ ¡protect ¡individuals ¡

  • AnonymizaSon ¡ ¡
  • DifferenSal ¡privacy ¡

¡ Already ¡studied ¡a ¡lot ¡ Topic ¡is ¡not ¡closed ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 23 ¡

slide-24
SLIDE 24

Issues: ¡Verifying ¡these ¡properSes ¡

  • Tools ¡to ¡collect ¡data ¡and ¡analyze ¡it ¡responsibly ¡
  • Tools ¡to ¡verify ¡that ¡some ¡analysis ¡was ¡performed ¡

responsibly ¡

  • Easier ¡if ¡responsibility ¡is ¡taken ¡into ¡account ¡as ¡

early ¡as ¡possible, ¡responsibility ¡by ¡design ¡ ¡

  • To ¡check ¡the ¡behavior ¡of ¡a ¡program, ¡one ¡can ¡ ¡

– Analyze ¡its ¡code ¡≈ ¡proof ¡of ¡mathemaScal ¡theorems ¡ – Analyze ¡its ¡effect ¡≈ ¡study ¡of ¡phenomena ¡(such ¡as ¡ climate ¡or ¡the ¡human ¡heart) ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 24 ¡

slide-25
SLIDE 25

VerificaSon: ¡code ¡analysis ¡

  • Possible ¡if ¡open-­‑source ¡-­‑ ¡otherwise ¡audiSng ¡
  • Easier ¡with ¡open-­‑source ¡

– not ¡sufficient: ¡bug ¡in ¡the ¡SSL ¡library ¡of ¡Debian ¡ ¡ – Weak ¡secrecy ¡of ¡keys ¡for ¡2 ¡years ¡

  • Specify ¡properSes ¡that ¡should ¡be ¡verified ¡
  • VerificaSon ¡based ¡on ¡staSc ¡analysis, ¡in ¡the ¡spirit ¡of ¡

theorem ¡proving ¡

  • Lots ¡of ¡work ¡in ¡different ¡areas ¡

– security, ¡safety, ¡opSmizaSon, ¡privacy ¡

  • Lirle ¡on ¡responsibility ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 25 ¡

slide-26
SLIDE 26

VerificaSon: ¡analysis ¡of ¡effects ¡

  • StaSsScal ¡analysis ¡

– Detect ¡biases ¡ – Detect ¡illegal ¡use ¡of ¡protected ¡arributes ¡

  • Verify ¡transparency ¡ ¡
  • Verify ¡“loyalty” ¡ ¡

– The ¡system ¡behaves ¡like ¡it ¡says ¡it ¡does ¡

¡

  • Example: ¡Google ¡Ads ¡Semngs ¡& ¡AdFisher ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 26 ¡

slide-27
SLIDE 27

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Google ¡Ads ¡Semngs ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 27 ¡

Anonymized ¡

slide-28
SLIDE 28

Transparency ¡and ¡accountability ¡

  • Analysis ¡by ¡AdFisher ¡
  • Doesn’t ¡behave ¡how ¡it ¡says ¡

– Choice ¡of ¡ads ¡is ¡based ¡on ¡more ¡data ¡that ¡it ¡says ¡

  • E.g., ¡protected ¡arributes ¡
  • Eg: ¡males ¡were ¡shown ¡ads ¡for ¡higher-­‑paying ¡jobs ¡

significantly ¡more ¡oYen ¡than ¡females ¡

  • Some ¡control ¡on ¡the ¡ads ¡

– Removing ¡an ¡interest ¡decreases ¡the ¡number ¡of ¡ads ¡ related ¡to ¡that ¡interest ¡ – Eg: ¡cats ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 28 ¡

slide-29
SLIDE 29

VerificaSon: ¡provenance ¡

  • Provenance ¡helps ¡verifying ¡the ¡analysis ¡
  • Common ¡for ¡scienSfic ¡data, ¡essenSal ¡for ¡

verifying ¡that ¡data ¡collecSon ¡and ¡analysis ¡ were ¡performed ¡responsibly ¡ ¡ Issue: ¡provenance ¡and ¡verificaSon ¡ Issue: ¡reproducibility ¡ ¡ ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 29 ¡

slide-30
SLIDE 30

DATA ¡QUALITY ¡EVALUATION ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 30 ¡

slide-31
SLIDE 31

Stuff ¡we ¡don’t ¡want ¡to ¡see ¡on ¡the ¡web ¡

  • Nazi ¡sites ¡
  • Terrorist ¡sites ¡ ¡
  • Pedophiliac ¡content ¡
  • Bogus ¡health ¡content ¡
  • Conspiracy ¡theory ¡content ¡
  • Cybercrime ¡ ¡
  • Cyberbullying ¡… ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 31 ¡

slide-32
SLIDE 32

Issues: ¡What ¡can ¡we ¡do ¡about ¡it ¡

  • Web ¡scale ¡monitoring ¡for ¡illegal ¡content ¡
  • Web ¡scale ¡automaSc ¡evaluaSon ¡of ¡ ¡

– Quality ¡of ¡content ¡ – Legality ¡of ¡content ¡ – Based ¡on ¡truth ¡and ¡authority ¡ranking ¡

  • Crowd-­‑based ¡analysis/raSng ¡of ¡web ¡pages ¡
  • ??? ¡

Lots ¡of ¡research ¡issues ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 32 ¡

slide-33
SLIDE 33

Beyond ¡evaluaSon: ¡acSve ¡ countermeasures ¡

  • Typical ¡situaSon ¡in ¡France ¡

– Terrorist ¡site ¡detected ¡and ¡reported ¡ – Long ¡legal ¡process ¡ – CondemnaSon ¡– ¡the ¡site ¡is ¡closed ¡ – A ¡mirror ¡reopens ¡in ¡a ¡very ¡short ¡Sme, ¡and ¡is ¡quickly ¡ referenced ¡on ¡the ¡web ¡

  • The ¡URL ¡has ¡been ¡prohibited ¡when ¡it ¡should ¡have ¡

been ¡the ¡content ¡

  • Technically, ¡it ¡is ¡possible ¡to ¡detect ¡the ¡content ¡

and ¡block ¡it ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 33 ¡

slide-34
SLIDE 34

DATA ¡DISSEMINATION ¡

  • 1. ProtecSng ¡data ¡out ¡there ¡
  • 2. Open ¡data ¡access ¡
  • 3. Neutrality ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 34 ¡

slide-35
SLIDE 35

¡ ¡ ¡ ¡ ¡ProtecSng ¡data ¡out ¡there ¡

  • For ¡the ¡data ¡we ¡have ¡on ¡the ¡Web, ¡ ¡

¡ ¡ ¡ ¡we ¡would ¡like ¡to ¡control ¡

– By ¡whom ¡it ¡is ¡read ¡ – How ¡is ¡transmired ¡ – How ¡it ¡is ¡modified ¡ – How ¡it ¡is ¡and ¡will ¡be ¡used ¡ ¡

  • We ¡would ¡like ¡to ¡keep ¡some ¡control ¡in ¡this ¡

distributed ¡semng ¡

– Web-­‑scale ¡access ¡control ¡

Lots ¡of ¡open ¡issues ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 35 ¡

slide-36
SLIDE 36

Examples ¡of ¡acSve ¡data ¡access ¡

  • AcSve ¡data ¡(acSvexml) ¡

Provenance ¡is ¡an ¡extensional ¡reference ¡to ¡a ¡source ¡ – AcSve ¡data ¡is ¡an ¡intensional ¡reference ¡ – Reflect ¡modificaSons ¡of ¡data ¡and/or ¡access ¡rights ¡

  • Auto-­‑deleSon ¡aYer ¡some ¡amount ¡of ¡Sme ¡ ¡

– Snapchat ¡ ¡ – Vanish ¡hrps://vanish.cs.washington.edu/ ¡

  • DeleSon ¡and ¡right ¡to ¡be ¡forgoren ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 36 ¡

slide-37
SLIDE 37

Example: ¡Distributed ¡access ¡control ¡ ¡ based ¡on ¡provenance ¡

  • Webdamlog ¡
  • Specifies ¡who ¡can ¡read ¡some ¡data ¡based ¡on ¡its ¡

provenance ¡

  • Datalog ¡(aka ¡declaraSve) ¡specificaSon ¡
  • Data ¡transmired ¡from ¡peer ¡to ¡peer ¡keeps ¡its ¡

access ¡rights ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 37 ¡

slide-38
SLIDE 38

Open ¡data ¡access ¡

  • Publishing ¡data ¡
  • Finding ¡data ¡
  • Using ¡data ¡
  • Based ¡on ¡the ¡licenses ¡CC ¡BY, ¡SA, ¡NC, ¡ND ¡ ¡

¡ Issues ¡

– Ontologies, ¡provenance, ¡workflows… ¡ – P2P ¡protecSon ¡of ¡CC ¡licenses ¡

¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 38 ¡

slide-39
SLIDE 39

Neutrality ¡

Net ¡and ¡plaporm ¡neutrality ¡(CNNum ¡report) ¡

  • net ¡neutrality ¡-­‑ ¡the ¡network ¡is ¡transporSng ¡data ¡

with ¡no ¡bias ¡based ¡on ¡source, ¡desSnaSon, ¡ content ¡… ¡

  • plaporm ¡neutrality ¡-­‑ ¡big ¡internet ¡plaporms ¡

should ¡not ¡discriminate ¡in ¡favor ¡of ¡their ¡own ¡ services ¡

  • Related ¡to ¡fairness ¡and ¡diversity, ¡verified ¡with ¡

transparency ¡tools ¡ The rich get richer, the poor get poorer

39 ¡ 4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-40
SLIDE 40

Power ¡comes ¡with ¡responsibility ¡

Power ¡ ¡

  • A ¡handful ¡of ¡big ¡players ¡command ¡most ¡of ¡the ¡world’s ¡

computaSonal ¡resources ¡and ¡most ¡of ¡the ¡data, ¡ including ¡all ¡of ¡your ¡personal ¡data ¡-­‑ ¡an ¡oligopoly ¡ Danger ¡ ¡

  • Threatens ¡fair ¡business ¡compeSSon ¡
  • Controls ¡what ¡informaSon ¡you ¡receive ¡
  • Can ¡guide ¡your ¡decisions ¡
  • Can ¡infringe ¡on ¡your ¡privacy ¡and ¡freedom ¡
  • Limits ¡your ¡freedom ¡

40 ¡ 4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡

slide-41
SLIDE 41

Google ¡anStrust ¡case ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 41 ¡

slide-42
SLIDE 42

Issues ¡

Testing neutrality Monitoring of neutrality

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 42 ¡

slide-43
SLIDE 43

DATA ¡MEMORY ¡

  • 1. Personal ¡data ¡
  • 2. Archiving ¡
  • 3. Web ¡archiving ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 43 ¡

slide-44
SLIDE 44

Remembering ¡data ¡ ¡

Issues: ¡decide ¡ ¡

– What ¡to ¡remember ¡ ¡ – What ¡to ¡forget ¡

  • Forgemng ¡is ¡a ¡key ¡to ¡abstracSng ¡

– Ranking, ¡summarizaSon… ¡ ¡

E.g., ¡ForgetIT ¡EU ¡project ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 44 ¡

slide-45
SLIDE 45

Conclusion ¡

Many ¡societal ¡and ¡poliScal ¡ fights ¡today ¡are ¡related ¡to ¡ data ¡ The ¡issues ¡are ¡clearly ¡non ¡

  • nly ¡technical ¡

¡ Time ¡to ¡change ¡the ¡way ¡we ¡ use ¡personal ¡data? ¡ Time ¡to ¡change ¡the ¡web? ¡ Organisms ¡are ¡working ¡on ¡it ¡

  • For ¡instance, ¡CNNum ¡

Governments ¡(US, ¡EU…) ¡ For ¡instance, ¡for ¡the ¡web ¡

  • Internet ¡Government ¡

Forum ¡(UN) ¡

  • Global ¡Internet ¡Policy ¡

Observatory ¡(EU?) ¡

  • W3C ¡Technology ¡Policy ¡

Internet ¡Group ¡ ¡

4/14/16 ¡ Data ¡& ¡Ethics, ¡Dagstuhl, ¡Serge ¡A. ¡ 45 ¡

slide-46
SLIDE 46

http://abiteboul.com http://binaire.blog.lemonde.fr