Differen'al Privacy with Bounded Priors: Reconciling U+lity - - PowerPoint PPT Presentation

differen al privacy with bounded priors
SMART_READER_LITE
LIVE PREVIEW

Differen'al Privacy with Bounded Priors: Reconciling U+lity - - PowerPoint PPT Presentation

Differen'al Privacy with Bounded Priors: Reconciling U+lity and Privacy in Genome-Wide Associa+on Studies Florian Tramr, Zhicong Huang, Erman Ayday,


slide-1
SLIDE 1

Differen'al ¡Privacy ¡with ¡Bounded ¡Priors: ¡

Reconciling ¡U+lity ¡and ¡Privacy ¡in ¡Genome-­‑Wide ¡Associa+on ¡Studies ¡ ¡

¡ Florian ¡Tramèr, ¡Zhicong ¡Huang, ¡Erman ¡Ayday, ¡Jean-­‑Pierre ¡Hubaux ¡ ¡ ACM ¡CCS ¡2015 ¡ Denver, ¡Colorado, ¡USA ¡ October ¡15, ¡2015 ¡ ¡

slide-2
SLIDE 2

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Outline ¡

  • Data ¡Privacy ¡and ¡Membership ¡Disclosure ¡

– Differen+al ¡Privacy ¡ – Posi+ve ¡Membership ¡Privacy ¡ – Prior-­‑Belief ¡Families ¡and ¡Equivalence ¡between ¡DP ¡and ¡PMP ¡

  • Bounded ¡Priors ¡

– Modeling ¡Adversaries ¡with ¡Limited ¡Background ¡Knowledge ¡ – Example: ¡Inference ¡A[acks ¡for ¡Genome-­‑Wide ¡Associa+on ¡Studies ¡

  • Evalua+on ¡

– Perturba+on ¡Mechanisms ¡for ¡GWAS ¡ – Trading ¡Privacy, ¡Medical ¡U+lity ¡and ¡Cost ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 2 ¡

slide-3
SLIDE 3

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Differen+al ¡Privacy1,2 ¡

  • Belonging ¡to ¡a ¡dataset ¡≈ ¡Not ¡belonging ¡to ¡it ¡
  • A ¡mechanism ¡𝒝 ¡provides ¡ε-­‑DP ¡iff ¡for ¡any ¡datasets ¡T1 ¡and ¡T2 ¡

differing ¡in ¡a ¡single ¡element, ¡and ¡any ¡S ¡⊆ ¡range(𝒝), ¡we ¡have: ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 3 ¡

T1 ¡ T2 ¡ T1 ¡ T2 ¡ Unbounded ¡DP ¡ Bounded ¡DP ¡

1 ¡Dwork. ¡“Differen+al ¡privacy”. ¡Automata, ¡languages ¡and ¡programming. ¡2006 ¡ 2 ¡Dwork ¡et ¡al. ¡“Calibra+ng ¡Noise ¡to ¡Sensi+vity ¡in ¡Private ¡Data ¡Analysis”. ¡TCC’06. ¡2006 ¡

Pr[A(T1) ∈ S] ≤ e✏ · Pr[A(T2) ∈ S]

slide-4
SLIDE 4

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Posi+ve ¡Membership ¡Privacy1 ¡

  • Data ¡Privacy: ¡protec+on ¡against ¡membership ¡disclosure ¡

– Adversary ¡should ¡not ¡learn ¡whether ¡an ¡en+ty ¡from ¡a ¡universe ¡ ¡ 𝒱 ¡= ¡{t1, ¡t2, ¡…} ¡belongs ¡to ¡the ¡dataset ¡T ¡ ¡ ¡ ¡

¡

  • Privacy: ¡posterior ¡belief ¡≈ ¡prior ¡belief ¡for ¡all ¡en++es ¡
  • Impossible ¡in ¡general! ¡(no ¡free ¡lunch) ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 4 ¡

T ¡ t ¡

Is ¡t ¡in ¡T ¡? ¡ I ¡am ¡now ¡sure ¡t ¡is ¡in ¡T ¡! ¡

𝒝 ¡ 𝒝(T) ¡

1 ¡Li ¡et ¡al. ¡“Membership ¡privacy: ¡a ¡unifying ¡framework ¡for ¡privacy ¡defini+ons”. ¡CCS ¡’13. ¡2013 ¡ ¡

slide-5
SLIDE 5

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Prior ¡Belief ¡Families1 ¡

  • Adversary’s ¡prior ¡belief:

¡Distribu+on ¡𝒠 ¡over ¡2𝒱 ¡ ¡over ¡2𝒱 ¡

  • Range ¡of ¡adversaries: ¡ ¡

¡Distribu+on ¡family ¡𝔼 ¡

  • A ¡mechanism ¡𝒝 ¡sa+sfies ¡(ε, ¡𝔼)-­‑PMP ¡iff ¡for ¡any ¡ ¡

)-­‑PMP ¡iff ¡for ¡any ¡ ¡ S ¡⊆ ¡range(𝒝), ¡any ¡prior ¡distribu+on ¡𝒠 ¡∊ ¡𝔼, ¡and ¡any ¡en+ty ¡ ¡ , ¡and ¡any ¡en+ty ¡ ¡ t ¡∊ ¡𝒱, ¡we ¡have ¡ ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 5 ¡

1 ¡Li ¡et ¡al. ¡“Membership ¡privacy: ¡a ¡unifying ¡framework ¡for ¡privacy ¡defini+ons”. ¡CCS ¡’13. ¡2013 ¡ ¡

Pr[t ∈ T | A(T) ∈ S] ≤ e✏ · Pr[t ∈ T] Pr[t / ∈ T | A(T) ∈ S] ≥ e−✏ · Pr[t / ∈ T]

slide-6
SLIDE 6

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

PMP ¡ó ¡DP1 ¡

  • Mutually ¡Independent ¡Distribu+ons: ¡

– 𝒠 ¡∊ ¡𝔼I ¡: ¡each ¡en+ty ¡t ¡is ¡in ¡T, ¡independently ¡with ¡probability ¡pt ¡ – 𝒠 ¡∊ ¡𝔼B ¡: ¡Same ¡as ¡above, ¡condi+oned ¡on ¡|T|=k, ¡for ¡some ¡k ¡

⇒ ¡Adversary ¡also ¡knows ¡the ¡size ¡of ¡the ¡dataset ¡T ¡ ¡

  • Theorem: ¡
  • We ¡focus ¡on ¡bounded ¡DP ¡(results ¡hold ¡for ¡unbounded ¡case) ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 6 ¡

1 ¡Li ¡et ¡al. ¡“Membership ¡privacy: ¡a ¡unifying ¡framework ¡for ¡privacy ¡defini+ons”. ¡CCS ¡’13. ¡2013 ¡ ¡

✏ - unbounded - DP ⇔ (✏, DI) - PMP ✏ - bounded

  • DP

⇔ (✏, DB)- PMP

slide-7
SLIDE 7

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Outline ¡

  • Data ¡Privacy ¡and ¡Membership ¡Disclosure ¡

– Differen+al ¡Privacy ¡ – Posi+ve ¡Membership ¡Privacy ¡ – Prior ¡Belief ¡Families ¡and ¡Equivalence ¡between ¡DP ¡and ¡PMP ¡

  • Bounded ¡Priors ¡

– Modeling ¡Adversaries ¡with ¡Limited ¡Background ¡Knowledge ¡ – Example: ¡Inference ¡A[acks ¡for ¡Genome-­‑Wide ¡Associa+on ¡Studies ¡

  • Evalua+on ¡

– Perturba+on ¡Mechanisms ¡for ¡GWAS ¡ – Trading ¡Privacy, ¡Medical ¡U+lity ¡and ¡Cost ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 7 ¡

slide-8
SLIDE 8

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Bounded ¡Priors ¡

  • Observa+on: ¡𝔼B ¡includes ¡adversarial ¡priors ¡with ¡arbitrarily ¡

high ¡certainty ¡about ¡all ¡en++es: ¡

  • Do ¡we ¡care ¡about ¡such ¡strong ¡adversaries? ¡

– All ¡en++es ¡except ¡t’ ¡have ¡no ¡privacy ¡a ¡priori ¡(w.r.t ¡membership ¡in ¡T) ¡ – The ¡membership ¡status ¡of ¡t’ ¡can ¡also ¡be ¡known ¡with ¡high ¡certainty ¡

  • Membership ¡is ¡extremely ¡rare ¡/ ¡extremely ¡likely ¡
  • Or ¡adversary ¡has ¡strong ¡background ¡knowledge ¡

– How ¡do ¡we ¡model ¡an ¡adversary ¡with ¡limited ¡a ¡priori ¡knowledge? ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 8 ¡

Pr[t 2 T] 2 {0, 1}, 8t 6= t0 2 U Pr[t0 2 T] 2 (0, 1)

slide-9
SLIDE 9

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Bounded ¡Priors ¡

  • We ¡consider ¡adversaries ¡with ¡the ¡following ¡priors: ¡

– En++es ¡are ¡independent ¡(size ¡of ¡dataset ¡possibly ¡known) ¡ – Pr[t ¡∊ ¡T] ¡∊ ¡{0,1} ¡for ¡some ¡en++es ¡

  • Adversary ¡might ¡know ¡membership ¡status ¡of ¡some ¡en++es ¡

– a ¡≤ ¡Pr[t ¡∊ ¡T] ¡≤ ¡b ¡for ¡other ¡en++es, ¡where ¡a>0 ¡and ¡b<1 ¡

  • For ¡an ¡“unknown” ¡en+ty, ¡membership ¡status ¡is ¡uncertain ¡a ¡priori ¡

– Denoted ¡𝔼B

[a,b] ¡ ¡(or ¡𝔼B a ¡ ¡if ¡a=b) ¡

  • Ques+ons: ¡

– Is ¡the ¡model ¡relevant ¡in ¡prac'ce ¡? ¡ – What ¡u'lity ¡can ¡we ¡gain ¡by ¡considering ¡a ¡relaxed ¡adversarial ¡seDng ¡? ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 9 ¡

slide-10
SLIDE 10

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Bounded ¡Priors ¡In ¡Prac+ce: ¡Example ¡

  • Genome-­‑Wide ¡Associa+on ¡Studies: ¡

– Case-­‑Control ¡study ¡(typically ¡Ncase ¡= ¡Nctrl) ¡ – Membership ¡in ¡case ¡group ¡⟺ ¡pa+ent ¡has ¡some ¡disease ¡ – Find ¡out ¡which ¡gene+c ¡varia+ons ¡(SNPs) ¡are ¡associated ¡with ¡disease ¡

  • Ex: ¡𝜓2 ¡test ¡for ¡each ¡SNP ¡(low ¡p-­‑value ¡⟺ ¡conclude ¡SNP ¡is ¡probably ¡associated) ¡
  • Re-­‑iden+fica+on ¡a[acks1,2: ¡

– Collect ¡published ¡aggregate ¡sta's'cs ¡for ¡the ¡case/control ¡groups ¡ – Use ¡a ¡vic'm’s ¡DNA ¡sample ¡& ¡sta's'cal ¡tes'ng ¡to ¡dis+nguish ¡between: ¡

  • H0: ¡vic+m ¡is ¡not ¡in ¡case ¡group ¡
  • H1: ¡vic+m ¡is ¡in ¡case ¡group ¡(vic+m ¡has ¡the ¡disease) ¡

– Assump'ons ¡(some ¡implicit): ¡

  • Ncase ¡& ¡Nctrl ¡are ¡known ¡(usually ¡published) ¡
  • En++es ¡are ¡independent ¡ ¡
  • Prior: ¡Pr[t ¡∊ ¡T] ¡= ¡Ncase ¡/ ¡(Ncase ¡+ ¡Nctrl) ¡⟹ ¡typically ¡½ ¡in ¡aNack ¡evalua'ons ¡

– ANacks ¡taken ¡seriously! ¡(some ¡sta+s+cs ¡removed ¡from ¡open ¡databases)3 ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 10 ¡

1 ¡Homer ¡et ¡al. ¡“Resolving ¡individuals ¡contribu+ng ¡trace ¡amounts ¡of ¡DNA ¡to ¡highly ¡complex ¡mixtures ¡using ¡high-­‑density ¡SNP ¡genotyping ¡microarrays”. ¡PLoS ¡gene+cs. ¡2008 ¡ 2 ¡Wang ¡et ¡al. ¡“Learning ¡Your ¡Iden+ty ¡and ¡Disease ¡from ¡Research ¡Papers: ¡Informa+on ¡Leaks ¡in ¡Genome ¡Wide ¡Associa+on ¡Study”. ¡CCS ¡’09. ¡2009 ¡ ¡ 3 ¡Zerhouni ¡and ¡Nabel. ¡"Protec+ng ¡aggregate ¡genomic ¡data”. ¡Science. ¡2008 ¡

slide-11
SLIDE 11

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Achieving ¡PMP ¡for ¡Bounded ¡Priors ¡

  • Recall: ¡ ¡

¡

  • (ε, ¡𝔼B)-­‑PMP: ¡
  • These ¡inequali+es ¡are ¡'ght ¡iff ¡Pr[t ¡∊ ¡T] ¡∊ ¡{0,1} ¡

– For ¡bounded ¡priors ¡(Pr[t ¡∊ ¡T] ¡∊ ¡[a,b]) ¡we ¡have: ¡ – Perturba+on ¡required ¡to ¡achieve ¡ε-­‑PMP ¡depends ¡on ¡[a,b] ¡ – Minimal ¡perturba+on ¡required ¡when ¡a ¡= ¡b ¡= ¡½ ¡ ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 11 ¡

✏-DP ⇔ (✏, DB)-PMP ✏-DP ⇒ (✏0, DB

[a,b])-PMP, where ✏0 < ✏

Pr[t ∈ T | A(T) ∈ S] ≤ e✏ · Pr[t ∈ T] Pr[t / ∈ T | A(T) ∈ S] ≥ e−✏ · Pr[t / ∈ T]

slide-12
SLIDE 12

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Privacy ¡– ¡U+lity ¡Tradeoff ¡

  • If ¡we ¡consider ¡bounded ¡adversaries ¡with ¡prior ¡in ¡𝔼B

[a,b] ¡

instead ¡of ¡adversaries ¡with ¡prior ¡in ¡𝔼B ¡: ¡

¡ ¡

– Are ¡we ¡s'll ¡protec'ng ¡against ¡relevant ¡threats? ¡✓ ¡ ¡⇒ ¡A[acks ¡proposed ¡on ¡GWAS ¡ ¡ – Can ¡we ¡gain ¡in ¡u'lity? ¡✓ ¡

⇒ ¡Less ¡data ¡perturba+on ¡required ¡ ⇒ ¡Actual ¡gain ¡to ¡be ¡evaluated ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 12 ¡

slide-13
SLIDE 13

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Outline ¡

  • Data ¡Privacy ¡and ¡Membership ¡Disclosure ¡

– Differen+al ¡Privacy ¡ – Posi+ve ¡Membership ¡Privacy ¡ – Prior ¡Belief ¡Families ¡and ¡Equivalence ¡between ¡DP ¡and ¡PMP ¡

  • Bounded ¡Priors ¡

– Modeling ¡Adversaries ¡with ¡Limited ¡Background ¡Knowledge ¡ – Example: ¡Inference ¡A[acks ¡for ¡Genome-­‑Wide ¡Associa+on ¡Studies ¡

  • Evalua+on ¡

– Perturba+on ¡Mechanisms ¡for ¡GWAS ¡ – Trading ¡Privacy, ¡Medical ¡U+lity ¡and ¡Cost ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 13 ¡

slide-14
SLIDE 14

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Evalua+on ¡

  • Sta+s+cal ¡Privacy ¡for ¡GWAS: ¡

– Laplace ¡/ ¡Exponen+al ¡mechanisms ¡based ¡on ¡𝜓2 ¡– ¡scores1,2 ¡ – Exponen+al ¡mechanism ¡with ¡specialized ¡distance ¡metric3 ¡

  • Tradeoffs: ¡

1. Privacy ¡ ¡ ¡Mi+gate ¡inference ¡a[acks ¡ 2. Output ¡U'lity ¡ ¡Associated ¡SNPs ¡should ¡be ¡output ¡ 3. Dataset ¡Size ¡ ¡Privacy ¡and ¡Cost ¡depend ¡on ¡number ¡of ¡pa+ents ¡

  • What ¡we ¡want ¡to ¡achieve: ¡

1. ε-­‑PMP ¡for: ¡

  • The ¡adversarial ¡se•ng ¡of ¡Homer ¡et ¡al., ¡Wang ¡et ¡al. ¡
  • Compared ¡to ¡an ¡unbounded ¡adversary ¡

2. High ¡probability ¡of ¡outpu•ng ¡the ¡correct ¡SNPs ¡ 3. Also ¡for ¡small ¡studies ¡(N ¡≃ ¡2000)4 ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 14 ¡

1 ¡Uhler, ¡Slavkovic, ¡and ¡Fienberg. ¡“Privacy-­‑Preserving ¡Data ¡Sharing ¡for ¡Genome-­‑Wide ¡Associa+on ¡Studies”. ¡Journal ¡of ¡Privacy ¡and ¡Confiden+ality. ¡2013 ¡ 2 ¡Yu ¡et ¡al. ¡“Scalable ¡privacy-­‑preserving ¡data ¡sharing ¡methodology ¡for ¡genome-­‑wide ¡associa+on ¡studies”. ¡Journal ¡of ¡biomedical ¡informa+cs. ¡2014 ¡ 3 ¡Johnson ¡and ¡Shma+kov. ¡“Privacy-­‑preserving ¡Data ¡Explora+on ¡in ¡Genome-­‑wide ¡Associa+on ¡Studies”. ¡KDD ¡’13. ¡2013 ¡ ¡ 4 ¡Spencer ¡et ¡al. ¡“Designing ¡genome-­‑wide ¡associa+on ¡studies: ¡sample ¡size, ¡power, ¡imputa+on, ¡and ¡the ¡choice ¡of ¡genotyping ¡chip”. ¡PLoS ¡gene+cs. ¡2009 ¡ ¡

slide-15
SLIDE 15

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Evalua+on ¡

  • GWAS ¡simula+on ¡with ¡8532 ¡SNPs, ¡2 ¡associated ¡SNPs ¡

– Variable ¡sample ¡size ¡N ¡ ¡(Ncase ¡= ¡Nctrl) ¡ – Sa+sfy ¡PMP ¡for ¡ε ¡= ¡ln(1.5) ¡ – Mechanism ¡𝒝 ¡protects ¡against ¡adversary ¡with ¡unbounded ¡prior ¡𝔼B ¡

  • 𝒝 ¡must ¡sa+sfy ¡ε-­‑DP ¡

– Mechanism ¡𝒝’ ¡protects ¡against ¡adversary ¡with ¡bounded ¡prior ¡𝔼B

½ ¡

  • It ¡is ¡sufficient ¡for ¡𝒝’ ¡ ¡to ¡sa+sfy ¡ε’-­‑DP ¡for ¡ε’ ¡= ¡ln(2) ¡

– Exponen+al ¡mechanism ¡from1 ¡: ¡ ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 15 ¡

1 ¡Johnson ¡and ¡Shma+kov. ¡“Privacy-­‑preserving ¡Data ¡Explora+on ¡in ¡Genome-­‑wide ¡Associa+on ¡Studies”. ¡KDD ¡’13. ¡2013 ¡ ¡

1500 2000 2500 0.25 0.5 0.75 1 Sample Size Probability A returned 1 associated SNP A returned both associated SNPs A′ returned 1 associated SNP A′ returned both associated SNPs

slide-16
SLIDE 16

CCS’15 ¡– ¡Denver, ¡Colorado ¡ October ¡15, ¡2015 ¡

Conclusion ¡

  • Membership ¡privacy ¡is ¡easier ¡to ¡guarantee ¡for ¡adversaries ¡with ¡

bounded ¡priors ¡

– Less ¡perturba'on ¡⟹ ¡Higher ¡u'lity ¡ – For ¡GWAS: ¡BeNer ¡tradeoff ¡between ¡dataset ¡size ¡and ¡u'lity ¡of ¡output ¡

  • We ¡can ¡tailor ¡privacy ¡mechanisms ¡to ¡specific ¡aNacks/threats ¡

– Can ¡we ¡make ¡reasonable ¡assump+ons ¡on ¡the ¡adversary’s ¡prior ¡beliefs? ¡ – For ¡GWAS: ¡known ¡a[acks ¡implicitly ¡rely ¡on ¡such ¡assump+ons ¡ – Compute ¡appropriate ¡level ¡of ¡noise ¡to ¡guarantee ¡bounds ¡on ¡adversary’s ¡ posterior ¡beliefs ¡

  • Future ¡Work: ¡

– Can ¡we ¡build ¡stronger ¡inference ¡a[acks ¡on ¡GWAS? ¡

⟹ ¡Infer ¡“rare” ¡membership ¡(disease ¡status ¡is ¡typically ¡rare ¡in ¡a ¡popula+on) ¡ ⟹ ¡Known ¡a[acks ¡are ¡less ¡successful ¡when ¡prior ¡Pr[t ¡∊ ¡T] ¡is ¡very ¡small1 ¡

– Direct ¡comparison: ¡aNack ¡success ¡rate ¡vs. ¡data ¡perturba'on ¡(u'lity)2 ¡

⟹ ¡Promote ¡a ¡“prac+ce-­‑oriented” ¡study ¡of ¡sta+s+cal ¡privacy ¡

Differen+al ¡Privacy ¡with ¡Bounded ¡Priors ¡ 16 ¡

1 ¡Sankararaman ¡et ¡al. ¡"Genomic ¡privacy ¡and ¡limits ¡of ¡individual ¡detec+on ¡in ¡a ¡pool." ¡Nature ¡gene+cs. ¡2009 ¡ 2 ¡Fredrikson ¡et ¡al. ¡"Privacy ¡in ¡pharmacogene+cs: ¡An ¡end-­‑to-­‑end ¡case ¡study ¡of ¡personalized ¡warfarin ¡dosing." ¡Proceedings ¡of ¡USENIX ¡Security. ¡2014 ¡