Differen'ally Private Loca'on Privacy in Prac'ce Vincent - - PowerPoint PPT Presentation

differen ally private loca on privacy in prac ce
SMART_READER_LITE
LIVE PREVIEW

Differen'ally Private Loca'on Privacy in Prac'ce Vincent - - PowerPoint PPT Presentation

Differen'ally Private Loca'on Privacy in Prac'ce Vincent Primault Sonia Ben Mokhtar Cdric Lauradoux Lionel Brunie May 17th 2014 Loca'on-based


slide-1
SLIDE 1

Differen'ally ¡Private ¡Loca'on ¡ Privacy ¡in ¡Prac'ce ¡

Vincent ¡Primault ¡ Sonia ¡Ben ¡Mokhtar ¡ Cédric ¡Lauradoux ¡ Lionel ¡Brunie ¡ ¡ ¡ May ¡17th ¡2014 ¡

slide-2
SLIDE 2

Loca'on-­‑based ¡services ¡

2 ¡

slide-3
SLIDE 3

3 ¡

slide-4
SLIDE 4

Loca'on ¡privacy ¡threats ¡

4 ¡

[1] ¡De ¡Montjoye ¡et ¡al. ¡Unique ¡in ¡the ¡Crowd: ¡The ¡privacy ¡bounds ¡of ¡human ¡mobility. ¡ Scien&fic ¡reports, ¡2013. ¡ [2] ¡Golle ¡et ¡al. ¡On ¡the ¡Anonymity ¡of ¡Home/Work ¡LocaBon ¡Pairs. ¡Pervasive’09. ¡ Anonymized ¡ mobility ¡ trace ¡ Par'ally ¡ re-­‑iden'fied ¡ mobility ¡ trace ¡ Clustering ¡ White ¡pages ¡ Public ¡maps ¡ ... ¡

Only ¡4 ¡points ¡are ¡sufficient ¡to ¡uniquely ¡iden'fy ¡you! ¡[1] ¡

slide-5
SLIDE 5

¡ ¡ Can ¡a ¡protec'on ¡mechanism ¡ ¡ efficiently ¡protect ¡ ¡ points ¡of ¡interest ¡of ¡a ¡user? ¡

5 ¡

slide-6
SLIDE 6

Outline ¡

  • Introduc'on ¡
  • About ¡points ¡of ¡interest ¡
  • Protec'on ¡mechanisms ¡
  • Experimental ¡seYngs ¡
  • Evalua'on ¡metrics ¡& ¡results ¡
  • Sum-­‑up ¡

6 ¡

slide-7
SLIDE 7

A ¡mobility ¡trace ¡

7 ¡

slide-8
SLIDE 8

Areas ¡of ¡interest ¡

8 ¡

slide-9
SLIDE 9

Points ¡of ¡interest ¡

9 ¡

slide-10
SLIDE 10

Outline ¡

  • Introduc'on ¡
  • About ¡points ¡of ¡interest ¡
  • ProtecBon ¡mechanisms ¡
  • Experimental ¡seYngs ¡
  • Evalua'on ¡metrics ¡& ¡results ¡
  • Sum-­‑up ¡

10 ¡

slide-11
SLIDE 11

Loca'on-­‑privacy ¡protec'on ¡ mechanisms ¡

11 ¡

Pseudonymity ¡ Mix-­‑zones ¡ Spa'al ¡cloaking ¡ k-­‑anonymity ¡ Cryptographic ¡ protocols ¡ Noise-­‑based ¡ solu'ons ¡

slide-12
SLIDE 12

Geo-­‑indis'nguishability ¡

12 ¡

[3] ¡Andrés ¡et ¡al. ¡Geo-­‑indisBnguishability: ¡DifferenBal ¡privacy ¡for ¡LocaBon-­‑based ¡

  • Systems. ¡CCS’13. ¡

Real ¡loca'on ¡ Reported ¡loca'on ¡

slide-13
SLIDE 13

Geo-­‑indis'nguishability ¡

13 ¡

[3] ¡Andrés ¡et ¡al. ¡Geo-­‑indisBnguishability: ¡DifferenBal ¡privacy ¡for ¡LocaBon-­‑based ¡

  • Systems. ¡CCS’13. ¡

l1, ¡r1 ¡ l2, ¡r2 ¡ l3, ¡r3 ¡ l4, ¡r4 ¡ Level ¡of ¡privacy ¡li ¡within ¡ri ¡propor'onal ¡to ¡an ¡ε ¡

Real ¡loca'on ¡ Reported ¡loca'on ¡

slide-14
SLIDE 14

Outline ¡

  • Introduc'on ¡
  • About ¡points ¡of ¡interest ¡
  • Protec'on ¡mechanisms ¡
  • Experimental ¡seMngs ¡
  • Evalua'on ¡metrics ¡& ¡results ¡
  • Sum-­‑up ¡

14 ¡

slide-15
SLIDE 15

Two ¡different ¡data ¡sets ¡

15 ¡

San ¡Francisco ¡cabs ¡ In ¡the ¡SF ¡Bay ¡Area ¡ 1 ¡month ¡in ¡2009 ¡ 536 ¡taxis ¡ 11 ¡millions ¡points ¡ Geolife ¡ Around ¡Beijing ¡ 4 ¡years ¡(2007-­‑2011) ¡ 182 ¡users ¡ 25 ¡millions ¡points ¡ Reduced ¡Geolife ¡ Around ¡Beijing ¡ 1 ¡con'nuous ¡month ¡ 61 ¡users ¡ 5 ¡millions ¡points ¡

slide-16
SLIDE 16

POIs ¡extrac'on ¡algorithm ¡

Mobility ¡trace ¡ Extract ¡stays ¡[4] ¡ Group ¡nearby ¡ stays ¡together ¡[5] ¡ POIs ¡ Time-­‑ordered ¡list ¡of ¡loca'ons ¡ Centroids ¡of ¡areas ¡where ¡a ¡user ¡has ¡spent ¡at ¡ ¡ least ¡minTime ¡within ¡a ¡maxDistance ¡radius ¡ Stays ¡within ¡¾ ¡maxDistance ¡where ¡a ¡user ¡ passed ¡through ¡at ¡least ¡minPts ¡'mes ¡ A ¡set ¡of ¡important ¡places ¡for ¡a ¡user ¡ [4] ¡Hariharan ¡et ¡al. ¡Project ¡Lachesis: ¡parsing ¡and ¡modeling ¡locaBon ¡histories. ¡GIScience’04. ¡ [5] ¡Zhou ¡et ¡al. ¡Discovering ¡Personal ¡GazeReers: ¡An ¡InteracBve ¡Clustering ¡Approach. ¡GIS’04. ¡

16 ¡

1 ¡hour ¡ ? ¡ 2 ¡'mes ¡

slide-17
SLIDE 17

Playing ¡with ¡distance ¡threshold ¡

SF ¡cabs ¡ Geolife ¡ Unobfuscated ¡ 250 ¡m ¡ 250 ¡m ¡ Weak ¡privacy ¡ 700 ¡m ¡ 600 ¡m ¡ Medium ¡privacy ¡ 1000 ¡m ¡ 1200 ¡m ¡ Strong ¡privacy ¡ 2000 ¡m ¡ 2500 ¡m ¡

17 ¡

¡ We ¡must ¡greatly ¡increase ¡the ¡maxDistance ¡ threshold ¡at ¡highest ¡privacy ¡levels ¡in ¡order ¡to ¡ retrieve ¡an ¡interes'ng ¡number ¡of ¡POIs. ¡

slide-18
SLIDE 18

Outline ¡

  • Introduc'on ¡
  • About ¡points ¡of ¡interest ¡
  • Protec'on ¡mechanisms ¡
  • Experimental ¡seYngs ¡
  • EvaluaBon ¡metrics ¡& ¡results ¡
  • Sum-­‑up ¡

18 ¡

slide-19
SLIDE 19

Measuring ¡privacy ¡

19 ¡

slide-20
SLIDE 20

Recall ¡rate ¡

Recall ¡rate ¡is ¡the ¡ propor'on ¡of ¡real ¡POIs ¡ successfully ¡retrieved. ¡

20 ¡

Recall ¡= ¡2/3 ¡

slide-21
SLIDE 21

Recall ¡rate ¡

SF ¡cabs ¡ Geolife ¡ Weak ¡privacy ¡ 73 ¡% ¡ 72 ¡% ¡ Medium ¡privacy ¡ 72 ¡% ¡ 71 ¡% ¡ Strong ¡privacy ¡ 71 ¡% ¡ 61 ¡% ¡

21 ¡

SF ¡cabs ¡ Geolife ¡ Reference ¡(unobfuscated) ¡ 1111 ¡POIs ¡ (~ ¡2/user) ¡ 258 ¡POIs ¡ (~ ¡4/user) ¡

slide-22
SLIDE 22

Geographic ¡distance ¡

Geographic ¡distance ¡ between ¡an ¡obfuscated ¡ POI ¡and ¡the ¡nearest ¡real ¡ POI ¡

22 ¡

slide-23
SLIDE 23

Cumula've ¡geographic ¡distance ¡

SF ¡cabs ¡ Geolife ¡

23 ¡

slide-24
SLIDE 24

Re-­‑iden'fica'on ¡rate ¡

Scenario: ¡I ¡use ¡a ¡LBS ¡without ¡any ¡protec'on ¡and ¡

  • ne ¡day, ¡I ¡use ¡a ¡geo-­‑indis'nguishable ¡
  • mechanism. ¡

¡ Will ¡my ¡privacy ¡be ¡preserved ¡or ¡will ¡the ¡LBS ¡be ¡ able ¡to ¡link ¡my ¡obfuscated ¡trace ¡with ¡my ¡original ¡ trace? ¡

24 ¡

slide-25
SLIDE 25

Re-­‑iden'fica'on ¡rate ¡

25 ¡

Real ¡POI ¡ Obfuscated ¡POI ¡

Distance ¡= ¡median(geographic ¡distances) ¡

slide-26
SLIDE 26

Re-­‑iden'fica'on ¡rate ¡

26 ¡

User ¡1 ¡ User ¡2 ¡ User ¡3 ¡ User ¡1 ¡ User ¡2 ¡ User ¡3 ¡

Real ¡POI ¡ Obfuscated ¡POI ¡

Re-­‑iden'fica'on ¡= ¡1/3 ¡

Associate ¡to ¡each ¡ set ¡of ¡obfuscated ¡ POIs ¡the ¡set ¡of ¡ real ¡POIs ¡with ¡ which ¡it ¡has ¡the ¡ minimal ¡distance. ¡

slide-27
SLIDE 27

Re-­‑iden'fica'on ¡rate ¡

27 ¡

  • Few ¡unique ¡parerns ¡in ¡SF ¡cabs ¡data ¡set, ¡

drivers ¡are ¡likely ¡to ¡have ¡a ¡similar ¡behavior. ¡

  • Mobility ¡parerns ¡can ¡be ¡captured ¡in ¡Geolife ¡

and ¡act ¡like ¡a ¡fingerprint. ¡

SF ¡cabs ¡ Geolife ¡ Strong ¡privacy ¡ 6 ¡% ¡ 63 ¡% ¡ Medium ¡privacy ¡ 8 ¡% ¡ 83 ¡% ¡ Weak ¡privacy ¡ 10 ¡% ¡ 90 ¡% ¡

slide-28
SLIDE 28

Measuring ¡precision ¡

28 ¡

Real ¡loca'on ¡ Reported ¡loca'on ¡

500 ¡m ¡ 900 ¡m ¡

Evic'on ¡rate ¡is ¡the ¡ ra'o ¡between ¡the ¡ number ¡of ¡useless ¡ results ¡and ¡the ¡total ¡ number ¡of ¡results. ¡ ¡ Precision ¡is ¡1 ¡minus ¡ the ¡evic'on ¡rate. ¡ ¡ ¡ ¡

Evic'on ¡= ¡6 ¡/ ¡10 ¡ Precision ¡= ¡4 ¡/ ¡10 ¡

Restaurant ¡

slide-29
SLIDE 29

Precision ¡of ¡results ¡when ¡querying ¡LBS ¡

¡

  • 100 ¡points ¡sampled ¡

from ¡the ¡SF ¡cabs ¡ dataset ¡

  • Use ¡a ¡"find ¡restaurants ¡

500 ¡meters ¡around ¡me" ¡ query ¡against ¡ OpenStreetMap ¡data ¡

0,00% ¡ 5,00% ¡ 10,00% ¡ 15,00% ¡ 20,00% ¡ 25,00% ¡ 30,00% ¡ 35,00% ¡ 40,00% ¡ Weak ¡ privacy ¡ Medium ¡ privacy ¡ Strong ¡ privacy ¡

29 ¡

slide-30
SLIDE 30

Outline ¡

  • Introduc'on ¡
  • About ¡points ¡of ¡interest ¡
  • Protec'on ¡mechanisms ¡
  • Experimental ¡seYngs ¡
  • Evalua'on ¡metrics ¡& ¡results ¡
  • Sum-­‑up ¡

30 ¡

slide-31
SLIDE 31

Conclusion ¡

  • Protec'on ¡mechanisms ¡improve ¡privacy… ¡

– but ¡s'll ¡allow ¡to ¡infer ¡a ¡large ¡quan'ty ¡of ¡sensi've ¡ informa'on ¡(> ¡60 ¡%) ¡ – at ¡the ¡cost ¡of ¡degraded ¡performance ¡

  • Difficult ¡to ¡achieve ¡a ¡trade-­‑off ¡between ¡

precision, ¡u'lity ¡and ¡performance ¡

31 ¡

slide-32
SLIDE 32

Future ¡work ¡

  • Study ¡the ¡exact ¡impact ¡of ¡the ¡temporal ¡

component ¡

  • Inves'gate ¡if ¡dynamically ¡adap'ng ¡the ¡privacy ¡

parameter ¡can ¡help ¡

  • Propose ¡counter-­‑measures ¡w.r.t. ¡our ¡

framework ¡and ¡related ¡work ¡

32 ¡

slide-33
SLIDE 33

Ques'ons? ¡

33 ¡