PrivApprox Privacy-Preserving Stream Analytics - - PowerPoint PPT Presentation

privapprox
SMART_READER_LITE
LIVE PREVIEW

PrivApprox Privacy-Preserving Stream Analytics - - PowerPoint PPT Presentation

PrivApprox Privacy-Preserving Stream Analytics https://privapprox.github.io Do Le Quoc, Martin Beck, Pramod Bhatotia, Ruichuan Chen, Christof Fetzer, Thorsten Strufe July 2017 Motivation Clients Analysts


slide-1
SLIDE 1

PrivApprox

Privacy-­‑Preserving ¡Stream ¡Analytics

July ¡2017

Do ¡Le ¡Quoc, ¡Martin ¡Beck, ¡ Pramod Bhatotia, ¡Ruichuan Chen, ¡Christof ¡Fetzer, ¡Thorsten ¡Strufe

https://privapprox.github.io

slide-2
SLIDE 2

Motivation

1

Private ¡data Recommendation, ¡Ads

Clients Analysts

slide-3
SLIDE 3

Motivation

1

Private ¡data Recommendation, ¡Ads

Strong ¡privacy ¡ guarantee Clients Analysts

slide-4
SLIDE 4

Motivation

1

Private ¡data Recommendation, ¡Ads

Strong ¡privacy ¡ guarantee High ¡utility ¡analytics ¡ in ¡real-­‑time Clients Analysts

slide-5
SLIDE 5

Motivation

1

Private ¡data Recommendation, ¡Ads

How ¡to ¡preserve ¡users’ ¡privacy while ¡supporting ¡high-­‑utility data ¡ analytics ¡for ¡low-­‑latency stream ¡processing? Strong ¡privacy ¡ guarantee High ¡utility ¡analytics ¡ in ¡real-­‑time Clients Analysts

slide-6
SLIDE 6

State-­‑of-­‑the-­‑art ¡systems

2

Clients

slide-7
SLIDE 7

State-­‑of-­‑the-­‑art ¡systems

2

Clients Personal ¡data ¡should ¡be ¡stored ¡locally ¡ under ¡the ¡clients’ ¡control

slide-8
SLIDE 8

State-­‑of-­‑the-­‑art ¡systems

2

Clients Personal ¡data ¡should ¡be ¡stored ¡locally ¡ under ¡the ¡clients’ ¡control

slide-9
SLIDE 9

State-­‑of-­‑the-­‑art ¡systems

2

Clients

slide-10
SLIDE 10

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

slide-11
SLIDE 11

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

Forward ¡ query ¡ ¡ Submit ¡ query ¡ ¡

slide-12
SLIDE 12

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

slide-13
SLIDE 13

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

Answer ¡ query ¡ ¡

slide-14
SLIDE 14

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

Answer ¡ query ¡ ¡ Add ¡noise

slide-15
SLIDE 15

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

slide-16
SLIDE 16

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

Differential ¡Privacy ¡ ¡ ¡ ¡

slide-17
SLIDE 17

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator Limitations:

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

Differential ¡Privacy ¡ ¡ ¡ ¡

slide-18
SLIDE 18

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator Limitations:

  • Deal ¡with ¡only ¡“single-­‑shot” ¡batch ¡queries ¡L

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

Differential ¡Privacy ¡ ¡ ¡ ¡

slide-19
SLIDE 19

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator Limitations:

  • Deal ¡with ¡only ¡“single-­‑shot” ¡batch ¡queries ¡L
  • Require ¡synchronization ¡between ¡system ¡components ¡L

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

Differential ¡Privacy ¡ ¡ ¡ ¡

slide-20
SLIDE 20

State-­‑of-­‑the-­‑art ¡systems

2

Clients Analyst Aggregator Limitations:

  • Deal ¡with ¡only ¡“single-­‑shot” ¡batch ¡queries ¡L
  • Require ¡synchronization ¡between ¡system ¡components ¡L
  • Require ¡a ¡trusted ¡aggregator ¡L

Answer ¡ query ¡ ¡ Privacy-­‑preserving ¡

  • utput

Add ¡noise

Differential ¡Privacy ¡ ¡ ¡ ¡

slide-21
SLIDE 21

PrivApprox

3

Clients ¡ Analyst PrivApprox

slide-22
SLIDE 22

PrivApprox

3

Clients ¡ Analyst PrivApprox PrivApprox:

slide-23
SLIDE 23

PrivApprox

3

Clients ¡ Analyst PrivApprox PrivApprox:

  • Supports ¡stream ¡processing ¡with ¡low ¡latency ¡J
slide-24
SLIDE 24

PrivApprox

3

Clients ¡ Analyst PrivApprox PrivApprox:

  • Supports ¡stream ¡processing ¡with ¡low ¡latency ¡J
  • Enables ¡a ¡truly ¡synchronization-­‑free distributed ¡architecture ¡J
slide-25
SLIDE 25

PrivApprox

3

Clients ¡ Analyst PrivApprox PrivApprox:

  • Supports ¡stream ¡processing ¡with ¡low ¡latency ¡J
  • Enables ¡a ¡truly ¡synchronization-­‑free distributed ¡architecture ¡J
  • Requires ¡lower ¡trust ¡in ¡aggregator ¡J
slide-26
SLIDE 26

Outline

  • Motivation
  • Overview
  • Design
  • Evaluation

4

slide-27
SLIDE 27

System ¡overview

5

PrivApprox

Clients Analyst

slide-28
SLIDE 28

System ¡overview

5

PrivApprox

Clients Analyst

(Query, ¡budget)

slide-29
SLIDE 29

System ¡overview

5

PrivApprox

Clients Analyst Execution ¡budget: ¡

  • Latency/throughput guarantees
  • Desired ¡computing ¡resources ¡for ¡query ¡processing
  • Desired ¡accuracy

(Query, ¡budget)

slide-30
SLIDE 30

System ¡overview

5

PrivApprox

Clients Analyst Execution ¡budget: ¡

  • Latency/throughput guarantees
  • Desired ¡computing ¡resources ¡for ¡query ¡processing
  • Desired ¡accuracy

(Query, ¡budget)

slide-31
SLIDE 31

System ¡overview

5

PrivApprox

Clients Analyst

slide-32
SLIDE 32

System ¡overview

5

PrivApprox

Clients Analyst

Result ¡

slide-33
SLIDE 33

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing Result ¡

slide-34
SLIDE 34

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing

Low ¡latency

Result ¡

slide-35
SLIDE 35

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing

Low ¡latency

Result ¡ Randomized ¡ response ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ +

slide-36
SLIDE 36

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing

Low ¡latency

Result ¡

Privacy ¡ ¡ ¡ ¡

Randomized ¡ response ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ +

slide-37
SLIDE 37

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing Result ¡ Randomized ¡ response ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ +

slide-38
SLIDE 38

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing Result ¡ Randomized ¡ response ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ +

Zero-­‑knowledge ¡Privacy ¡ ¡ ¡ ¡

slide-39
SLIDE 39

System ¡overview

5

PrivApprox

Clients Analyst

Approximate ¡ computing Result ¡ Randomized ¡ response ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ +

Zero-­‑knowledge ¡Privacy ¡ ¡ ¡ ¡ Zero-­‑knowledge ¡Privacy ¡> Differential ¡Privacy ¡ ¡ ¡ ¡

slide-40
SLIDE 40

#1: ¡Approximate ¡computing

6

slide-41
SLIDE 41

#1: ¡Approximate ¡computing

6

(Privacy-­‑preserving) ¡ ¡ ¡ ¡ approximate ¡output

Compute Add ¡noise State-­‑of-­‑the-­‑art-­‑systems

slide-42
SLIDE 42

#1: ¡Approximate ¡computing

6

(Privacy-­‑preserving) ¡ ¡ ¡ ¡ approximate ¡output

Compute Add ¡noise State-­‑of-­‑the-­‑art-­‑systems Idea: ¡To ¡achieve ¡low ¡latency, ¡compute ¡over ¡a ¡sub-­‑set ¡of ¡data ¡items ¡ instead ¡of ¡the ¡entire ¡data-­‑set

slide-43
SLIDE 43

#1: ¡Approximate ¡computing

6

(Privacy-­‑preserving) ¡ ¡ ¡ ¡ approximate ¡output

Compute Add ¡noise State-­‑of-­‑the-­‑art-­‑systems

Take ¡a ¡ sample Approximate ¡output ¡ ± Error ¡bound ¡

Compute Approximate ¡computing Idea: ¡To ¡achieve ¡low ¡latency, ¡compute ¡over ¡a ¡sub-­‑set ¡of ¡data ¡items ¡ instead ¡of ¡the ¡entire ¡data-­‑set

slide-44
SLIDE 44

#2: ¡Randomized ¡response

7

slide-45
SLIDE 45

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time

slide-46
SLIDE 46

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time Client

slide-47
SLIDE 47

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time Client

slide-48
SLIDE 48

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time

Truthful ¡ Answer

Client

slide-49
SLIDE 49

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time

Truthful ¡ Answer

Client

slide-50
SLIDE 50

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time

Truthful ¡ Answer

Client

“No” “Yes”

slide-51
SLIDE 51

#2: ¡Randomized ¡response

7

Idea: ¡ ¡To ¡preserve ¡privacy, ¡clients ¡may ¡not ¡need ¡to ¡provide ¡ truthful ¡answers ¡every ¡time

Truthful ¡ Answer

Provides ¡plausible ¡deniability ¡for ¡clients ¡ ¡responding ¡to ¡sensitive ¡ queries; ¡achieves ¡differential ¡privacy ¡(RAPPOR ¡[CCS’14]) Client

“No” “Yes”

slide-52
SLIDE 52

Outline

  • Motivation
  • Overview
  • Design
  • Evaluation

8

slide-53
SLIDE 53

Query ¡model

9

slide-54
SLIDE 54

Query ¡model

9

Divide ¡answer’s ¡value ¡range ¡into ¡buckets, ¡ enforce ¡a ¡binary ¡answer in ¡each ¡bucket

slide-55
SLIDE 55

Query ¡model

9

Query: ¡SELECT ¡age ¡FROM ¡clients ¡WHERE ¡city ¡= ¡‘Santa ¡Clara’ Divide ¡answer’s ¡value ¡range ¡into ¡buckets, ¡ enforce ¡a ¡binary ¡answer in ¡each ¡bucket

slide-56
SLIDE 56

Query ¡model

9

Query: ¡SELECT ¡age ¡FROM ¡clients ¡WHERE ¡city ¡= ¡‘Santa ¡Clara’

1-­‑20 41-­‑50 31-­‑40 21-­‑30 51-­‑60 >60

Divide ¡answer’s ¡value ¡range ¡into ¡buckets, ¡ enforce ¡a ¡binary ¡answer in ¡each ¡bucket

slide-57
SLIDE 57

Query ¡model

9

Query: ¡SELECT ¡age ¡FROM ¡clients ¡WHERE ¡city ¡= ¡‘Santa ¡Clara’

1-­‑20 41-­‑50 31-­‑40 21-­‑30 51-­‑60 >60

Age: ¡31

1

Divide ¡answer’s ¡value ¡range ¡into ¡buckets, ¡ enforce ¡a ¡binary ¡answer in ¡each ¡bucket

slide-58
SLIDE 58

Query ¡model

9

Query: ¡SELECT ¡age ¡FROM ¡clients ¡WHERE ¡city ¡= ¡‘Santa ¡Clara’ Client ¡cannot ¡arbitrarily ¡manipulate ¡answers ¡

1-­‑20 41-­‑50 31-­‑40 21-­‑30 51-­‑60 >60

Age: ¡31

1

Divide ¡answer’s ¡value ¡range ¡into ¡buckets, ¡ enforce ¡a ¡binary ¡answer in ¡each ¡bucket

slide-59
SLIDE 59

Workflow: ¡Submit ¡query

10

Aggregator

(Query, ¡budget)

Analyst

slide-60
SLIDE 60

Workflow: ¡Submit ¡query

10

Aggregator Cost-­‑Function(budget) System ¡parameters:

  • Sampling ¡parameter
  • Randomized ¡response ¡parameters

Clients

(Query, ¡budget)

Analyst

slide-61
SLIDE 61

Workflow: ¡Submit ¡query

10

Aggregator Cost-­‑Function(budget) System ¡parameters:

  • Sampling ¡parameter
  • Randomized ¡response ¡parameters

Clients

(Query, ¡budget)

Analyst

(Query, ¡parameters)

slide-62
SLIDE 62

Workflow: ¡Answer ¡query

11

slide-63
SLIDE 63

Workflow: ¡Answer ¡query

11

Client

slide-64
SLIDE 64

Workflow: ¡Answer ¡query

11

Step ¡#1 Sampling

(Flip ¡a ¡coin ¡to ¡decide ¡to ¡ answer ¡query ¡or ¡not)

Client

slide-65
SLIDE 65

Workflow: ¡Answer ¡query

11

Randomized ¡ Response Step ¡#2 Step ¡#1 Sampling

(Flip ¡a ¡coin ¡to ¡decide ¡to ¡ answer ¡query ¡or ¡not)

Client

slide-66
SLIDE 66

Workflow: ¡Answer ¡query

11

Randomized ¡ Response Step ¡#2 Send ¡randomized ¡ answer Step ¡#3 Step ¡#1 Sampling

(Flip ¡a ¡coin ¡to ¡decide ¡to ¡ answer ¡query ¡or ¡not)

Client

slide-67
SLIDE 67

Workflow: ¡Answer ¡query

11

Randomized ¡ Response Step ¡#2 Zero-­‑knowledge ¡privacy Send ¡randomized ¡ answer Step ¡#3 Step ¡#1 Sampling

(Flip ¡a ¡coin ¡to ¡decide ¡to ¡ answer ¡query ¡or ¡not)

Client

slide-68
SLIDE 68

Workflow: ¡Answer ¡query

11

Randomized ¡ Response Step ¡#2 Zero-­‑knowledge ¡privacy Send ¡randomized ¡ answer Step ¡#3 Step ¡#1 Sampling

(Flip ¡a ¡coin ¡to ¡decide ¡to ¡ answer ¡query ¡or ¡not)

Client

See ¡the ¡paper ¡for ¡details!

slide-69
SLIDE 69

Workflow: ¡Answer ¡query

12

Aggregator Clients

Randomized ¡ answers

slide-70
SLIDE 70

Workflow: ¡Answer ¡query

12

Aggregator Clients

Randomized ¡ answers

Analyst

Approximate ¡result ± Error ¡bound

slide-71
SLIDE 71

Workflow: ¡Answer ¡query

12

Aggregator Clients Lack ¡of ¡anonymity ¡and ¡unlinkability?

Randomized ¡ answers

Analyst

Approximate ¡result ± Error ¡bound

slide-72
SLIDE 72

#3: ¡Anonymity ¡and ¡unlinkability

13

slide-73
SLIDE 73

#3: ¡Anonymity ¡and ¡unlinkability

13

Idea: ¡XOR-­‑based ¡Encryption

slide-74
SLIDE 74

#3: ¡Anonymity ¡and ¡unlinkability

13

Idea: ¡XOR-­‑based ¡Encryption Client

slide-75
SLIDE 75

#3: ¡Anonymity ¡and ¡unlinkability

13

Idea: ¡XOR-­‑based ¡Encryption Client Encrypt ¡answer ¡M: GenerateKey -­‑> ¡Mk M XOR Mk -­‑> ME

slide-76
SLIDE 76

#3: ¡Anonymity ¡and ¡unlinkability

13

Idea: ¡XOR-­‑based ¡Encryption Client Encrypt ¡answer ¡M: GenerateKey -­‑> ¡Mk M XOR Mk -­‑> ME Proxy Proxy Aggregator

slide-77
SLIDE 77

#3: ¡Anonymity ¡and ¡unlinkability

13

Idea: ¡XOR-­‑based ¡Encryption Client Encrypt ¡answer ¡M: GenerateKey -­‑> ¡Mk M XOR Mk -­‑> ME Decrypt ¡answer ¡ME: ME XOR Mk -­‑> ¡M Proxy Proxy Aggregator

slide-78
SLIDE 78

Implementation

14

Aggregator Analyst

Proxy Proxy Clients

slide-79
SLIDE 79

Implementation

14

Aggregator Analyst

Proxy Proxy Clients

slide-80
SLIDE 80

Implementation

14

Aggregator Analyst

Proxy Proxy Clients

slide-81
SLIDE 81

Implementation

14

Aggregator Analyst

Proxy Proxy Clients

slide-82
SLIDE 82

Outline

  • Motivation
  • Overview
  • Design
  • Evaluation

15

slide-83
SLIDE 83

Experimental ¡setup

  • Evaluation ¡questions
  • Utility ¡vs ¡privacy
  • Throughput ¡& ¡latency ¡
  • Network ¡overhead

16

slide-84
SLIDE 84

Experimental ¡setup

  • Evaluation ¡questions
  • Utility ¡vs ¡privacy
  • Throughput ¡& ¡latency ¡
  • Network ¡overhead

16

See ¡the ¡paper ¡ for ¡more ¡ results!

slide-85
SLIDE 85

Experimental ¡setup

  • Evaluation ¡questions
  • Utility ¡vs ¡privacy
  • Throughput ¡& ¡latency ¡
  • Network ¡overhead
  • Testbed
  • Cluster: ¡44 ¡nodes ¡
  • Dataset: ¡NYC ¡Taxi ¡ride ¡records, ¡ household ¡electricity ¡usage

16

See ¡the ¡paper ¡ for ¡more ¡ results!

slide-86
SLIDE 86

Accuracy ¡vs ¡privacy

17

slide-87
SLIDE 87

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

slide-88
SLIDE 88

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

Trade-­‑off ¡between ¡utility ¡and ¡privacy The ¡lower the ¡better

Privacy ¡level Accuracy ¡loss

slide-89
SLIDE 89

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

Trade-­‑off ¡between ¡utility ¡and ¡privacy The ¡lower the ¡better

Privacy ¡level Accuracy ¡loss

slide-90
SLIDE 90

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

Trade-­‑off ¡between ¡utility ¡and ¡privacy The ¡lower the ¡better

Privacy ¡level Accuracy ¡loss

slide-91
SLIDE 91

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

Trade-­‑off ¡between ¡utility ¡and ¡privacy The ¡lower the ¡better

Privacy ¡level Accuracy ¡loss

slide-92
SLIDE 92

Accuracy ¡vs ¡privacy

1 2 3 4 5 6 0.1 0.2 0.3 0.4 0.5 0.6 10 20 40 60 80 90

Privacy ¡ ¡(εzk) Accuracy ¡loss ¡(%) Sampling ¡Fraction ¡(%)

Randomization ¡parameters ¡#1 ¡(p ¡= ¡0.6, ¡q ¡= ¡0.6) Randomization ¡parameters ¡#2 ¡(p ¡= ¡0.9, ¡q ¡= ¡0.6)

17

Trade-­‑off ¡between ¡utility ¡and ¡privacy The ¡lower the ¡better

Privacy ¡level Accuracy ¡loss

slide-93
SLIDE 93

Throughput

18

slide-94
SLIDE 94

Throughput

18

500 1000 1500 2000 2500 1 5 10 15 20

Throughput ¡(K) #nodes

NYC ¡Taxi ¡Ride Household ¡Electricity

slide-95
SLIDE 95

Throughput

18

500 1000 1500 2000 2500 1 5 10 15 20

Throughput ¡(K) #nodes

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡higher the ¡better

slide-96
SLIDE 96

Throughput

18

500 1000 1500 2000 2500 1 5 10 15 20

Throughput ¡(K) #nodes

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡higher the ¡better

slide-97
SLIDE 97

Throughput

18

500 1000 1500 2000 2500 1 5 10 15 20

Throughput ¡(K) #nodes

NYC ¡Taxi ¡Ride Household ¡Electricity

~8X speedup ¡when ¡going from ¡one ¡node ¡to ¡20 ¡nodes The ¡higher the ¡better

slide-98
SLIDE 98

Latency

19

slide-99
SLIDE 99

Latency

19

500 1000 1500 2000 10 20 40 60 80 90 Native

Total ¡processing ¡time ¡ (seconds) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity Native ¡

slide-100
SLIDE 100

Latency

19

500 1000 1500 2000 10 20 40 60 80 90 Native

Total ¡processing ¡time ¡ (seconds) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡lower the ¡better

Native ¡

slide-101
SLIDE 101

Latency

19

500 1000 1500 2000 10 20 40 60 80 90 Native

Total ¡processing ¡time ¡ (seconds) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡lower the ¡better

Native ¡

slide-102
SLIDE 102

Latency

19

500 1000 1500 2000 10 20 40 60 80 90 Native

Total ¡processing ¡time ¡ (seconds) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡lower the ¡better ~1.66X lower ¡than ¡the ¡native ¡execution ¡with ¡sampling ¡fraction ¡of ¡60%

Native ¡

slide-103
SLIDE 103

Network ¡overhead

20

slide-104
SLIDE 104

Network ¡overhead

20

100 200 300 400 500 600 10 20 40 60 80 90 Native

Network ¡traffic ¡(GB) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity Native ¡

slide-105
SLIDE 105

Network ¡overhead

20

100 200 300 400 500 600 10 20 40 60 80 90 Native

Network ¡traffic ¡(GB) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡lower the ¡better

Native ¡

slide-106
SLIDE 106

Network ¡overhead

20

100 200 300 400 500 600 10 20 40 60 80 90 Native

Network ¡traffic ¡(GB) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

The ¡lower the ¡better

Native ¡

slide-107
SLIDE 107

Network ¡overhead

20

100 200 300 400 500 600 10 20 40 60 80 90 Native

Network ¡traffic ¡(GB) Sampling ¡fraction ¡(%)

NYC ¡Taxi ¡Ride Household ¡Electricity

~1.6X lower ¡than ¡the ¡native ¡execution ¡with ¡sampling ¡fraction ¡of ¡60% The ¡lower the ¡better

Native ¡

slide-108
SLIDE 108

Conclusion

21

PrivApprox: a ¡privacy-­‑preserving ¡stream ¡analytics ¡system ¡over ¡ distributed ¡datasets

slide-109
SLIDE 109

Conclusion

21

PrivApprox: a ¡privacy-­‑preserving ¡stream ¡analytics ¡system ¡over ¡ distributed ¡datasets

Privacy Zero-­‑knowledge ¡privacy

slide-110
SLIDE 110

Conclusion

21

PrivApprox: a ¡privacy-­‑preserving ¡stream ¡analytics ¡system ¡over ¡ distributed ¡datasets

Practical Adaptive ¡execution ¡based ¡on ¡query ¡budget Privacy Zero-­‑knowledge ¡privacy

slide-111
SLIDE 111

Conclusion

21

PrivApprox: a ¡privacy-­‑preserving ¡stream ¡analytics ¡system ¡over ¡ distributed ¡datasets

Practical Adaptive ¡execution ¡based ¡on ¡query ¡budget Efficient Randomized ¡response ¡& ¡sampling ¡techniques Privacy Zero-­‑knowledge ¡privacy

slide-112
SLIDE 112

Conclusion

21

PrivApprox: a ¡privacy-­‑preserving ¡stream ¡analytics ¡system ¡over ¡ distributed ¡datasets

Practical Adaptive ¡execution ¡based ¡on ¡query ¡budget Efficient Randomized ¡response ¡& ¡sampling ¡techniques

Thank ¡you!

https://privapprox.github.io

Privacy Zero-­‑knowledge ¡privacy