Early Experience with the Distributed Nebula Cloud - - PowerPoint PPT Presentation

early experience with the distributed nebula cloud
SMART_READER_LITE
LIVE PREVIEW

Early Experience with the Distributed Nebula Cloud - - PowerPoint PPT Presentation

Early Experience with the Distributed Nebula Cloud Pradeep Sundarrajan, Abhishek Gupta, Mathew Ryden, Abhishek Chandra, Jon Weissman Department of


slide-1
SLIDE 1

Early ¡Experience ¡with ¡the ¡Distributed ¡ Nebula ¡Cloud ¡ ¡

¡

Pradeep ¡Sundarrajan, ¡Abhishek ¡Gupta, ¡Mathew ¡Ryden, ¡ Abhishek ¡Chandra, ¡Jon ¡Weissman ¡ ¡ Department ¡of ¡CS&E ¡ University ¡of ¡Minnesota ¡ ¡

slide-2
SLIDE 2

Outline ¡

  • ConvenIonal ¡cloud ¡
  • LimitaIons ¡and ¡opportuniIes ¡
  • Nebula ¡project ¡

¡

slide-3
SLIDE 3

The ¡“Standard” ¡Cloud ¡

Results

  • ut

Data in

“No limits” § Storage § Computing

Computation

slide-4
SLIDE 4

Current ¡Cloud ¡Model ¡

  • Largely ¡centralized ¡
  • Pay-­‑as-­‑you-­‑go ¡
  • Strong ¡guarantees ¡
  • 3rd ¡party ¡
slide-5
SLIDE 5

Appealing ¡Features ¡

  • Scale/consolidaIon ¡

– elasIcity, ¡lower ¡TCO ¡

  • Strong ¡locality ¡

– data ¡and ¡compuIng ¡=> ¡great ¡for ¡analyIcs ¡

  • Novel ¡sharing ¡plaVorm ¡

– data/state ¡and ¡applicaIons ¡=> ¡gaming, ¡Web ¡2.0 ¡ ¡

slide-6
SLIDE 6

Fraying ¡at ¡the ¡Edges ¡

  • Privacy ¡

– don’t ¡want ¡everything ¡going ¡to ¡the ¡cloud ¡but ¡ some ¡things ¡

  • Social/community ¡networks ¡

– limited ¡sharing ¡

  • Locality ¡ ¡

– largely ¡centralized ¡cloud ¡=> ¡bo[lenecks ¡

  • to ¡users ¡… ¡ ¡
  • to/from ¡data ¡sources ¡… ¡(think: ¡Big ¡Data) ¡
slide-7
SLIDE 7

Big ¡Data ¡Trend ¡

  • Big ¡data ¡is ¡distributed ¡

– earth ¡science: ¡weather ¡data, ¡seismic ¡data ¡ – life ¡science: ¡GenBank, ¡NCI ¡BLAST, ¡PubMed ¡ – health ¡science: ¡GoogleEarth ¡+ ¡CDC ¡pandemic ¡data ¡ – web ¡2.0: ¡user ¡mulImedia ¡blogs ¡ – “everyone ¡is ¡a ¡sensor” ¡

slide-8
SLIDE 8

Privacy/Locality ¡Trend ¡

  • Privacy ¡

– restrict/filter ¡data ¡(think: ¡paIent ¡records) ¡

  • Locality ¡ ¡

– mobile ¡users: ¡latency ¡sensiIve ¡applicaIon ¡access ¡ – criIcality: ¡ ¡“deliver ¡go-­‑signal ¡to ¡my ¡insulin ¡pump” ¡

slide-9
SLIDE 9

Need ¡New ¡Features ¡

  • Process ¡data ¡in-­‑situ ¡or ¡close ¡by ¡ ¡

– save ¡Ime ¡and ¡money ¡ – privacy-­‑aware ¡

  • Organize ¡plaVorm ¡based ¡different ¡noIons ¡of ¡

“closeness” ¡

– network ¡distance ¡ – trusted ¡nodes ¡ – social ¡groups ¡ – communiIes ¡of ¡interest ¡ ¡

slide-10
SLIDE 10

Idea ¡

  • Make ¡the ¡cloud ¡more ¡“distributed” ¡

– “move” ¡it ¡closer ¡to ¡data ¡ – “move” ¡it ¡closer ¡to ¡end-­‑users ¡ – “move” ¡it ¡closer ¡to ¡other ¡clouds ¡ ¡ ¡

slide-11
SLIDE 11

Example: ¡Dispersed-­‑Data-­‑Intensive ¡ Services ¡

n Data ¡is ¡geographically ¡distributed ¡

n Costly, ¡inefficient ¡to ¡move ¡to ¡central ¡locaIon ¡

slide-12
SLIDE 12

Example: ¡Blog ¡Analysis ¡

blog1 ¡ blog2 ¡ blog3 ¡

slide-13
SLIDE 13

Nebula: ¡A ¡New ¡Cloud ¡Model ¡

  • Stretch ¡the ¡cloud ¡

– exploit ¡the ¡rich ¡collecIon ¡of ¡edge ¡computers ¡ ¡ – volunteers ¡(P2P, ¡@home), ¡commercial ¡(CDNs) ¡ ¡

Nebula ¡ Central ¡

slide-14
SLIDE 14

Nebula ¡

  • Decentralized, ¡less-­‑managed ¡cloud ¡

– dispersed ¡storage/compute ¡resources ¡ – low ¡user ¡cost ¡

Users

slide-15
SLIDE 15

Example: ¡Blog ¡Analysis ¡

blog1 ¡ blog2 ¡ blog3 ¡

slide-16
SLIDE 16

Blog ¡Results ¡

0 ¡ 20000 ¡ 40000 ¡ 60000 ¡ 80000 ¡ 100000 ¡ 120000 ¡ 140000 ¡ 40 ¡ 80 ¡ 120 ¡ 160 ¡ 240 ¡ 320 ¡

Time ¡taken ¡(sec) ¡

Amazon ¡ ¡ emulator ¡ ¡ Nebula ¡ testbed ¡

# Blogs

slide-17
SLIDE 17

Failure ¡Resistant ¡

0 ¡ 50000 ¡ 100000 ¡ 150000 ¡ 200000 ¡ 250000 ¡ 300000 ¡ 350000 ¡ 400000 ¡ 450000 ¡ 500000 ¡ 400 ¡ 480 ¡ 560 ¡ 640 ¡ 720 ¡ 800 ¡ Time ¡Taken ¡(ms) ¡ Totan ¡Number ¡of ¡Blogs ¡ CCE ¡-­‑ ¡0 ¡Failures ¡ Nebula ¡-­‑ ¡0 ¡Failures ¡ Nebula ¡-­‑ ¡1 ¡Failure ¡ Nebula ¡-­‑ ¡2 ¡Failure ¡ Nebula ¡-­‑ ¡3 ¡Failure ¡

slide-18
SLIDE 18

Another ¡Example: ¡Latency-­‑SensiIve ¡

  • Mobile ¡service ¡

Tour

  • f

Paris

slide-19
SLIDE 19

How ¡is ¡Nebula ¡different ¡from ¡@home? ¡

Requirement ¡ Nebula ¡ @home ¡ CollecIve ¡ performance ¡ High ¡ None ¡ Locality/Context-­‑ awareness ¡ High ¡ Low ¡ Statefulness ¡ High/medium ¡ Low ¡

slide-20
SLIDE 20

Common ¡Service ¡CharacterisIcs ¡

  • ElasIc ¡resource ¡consumpIon ¡

– scale ¡up/down ¡based ¡on ¡demand ¡

  • Geographical ¡data/user ¡distribuIon ¡

– execuIon ¡dependent ¡on ¡locaIon ¡of ¡data/user ¡ ¡

  • Weak ¡performance/robustness ¡requirements ¡

– some ¡failures ¡may ¡be ¡tolerable ¡

slide-21
SLIDE 21

Inside ¡Nebula ¡

  • Nebula ¡central ¡
  • Chrome ¡
  • Dashboard ¡
  • Datastore ¡ ¡

Nebula ¡ Central ¡

slide-22
SLIDE 22

Nebula ¡Central ¡

  • Manager ¡
  • Volunteers ¡check-­‑in ¡
  • Tracks ¡global ¡state ¡of ¡other ¡services ¡
  • Distributes ¡code ¡and ¡nebula ¡soqware ¡
  • Run ¡at ¡UMn ¡
  • Central ¡point ¡of ¡trust ¡

Nebula ¡ Central ¡

slide-23
SLIDE 23

DataStore ¡

  • Data ¡service ¡that ¡runs ¡on ¡subset ¡of ¡nodes ¡
  • Provides ¡basic ¡store/retrieval ¡
  • Policy-­‑based ¡management ¡for ¡a ¡specific ¡DS ¡

– capacity, ¡latency, ¡fault ¡tolerance, ¡durability ¡

slide-24
SLIDE 24

SecureNode ¡

  • Nebula ¡nodes ¡run ¡a ¡Chrome ¡Browser ¡

– secure ¡sandbox ¡(NaCL) ¡naIve ¡client ¡inside ¡ – all ¡naIve ¡code ¡executes ¡inside ¡it ¡

slide-25
SLIDE 25

Network ¡Dashboard ¡

  • Soqware ¡tool ¡netstat.cs.umn.edu
  • Runs ¡on ¡all ¡nebula ¡nodes ¡
  • Provides ¡point-­‑to-­‑point ¡latency, ¡ji[er, ¡

bandwidth ¡

  • Used ¡by ¡DataStore ¡service, ¡NodeGroup ¡service

¡ (future) ¡

slide-26
SLIDE 26

Dashboard ¡Output ¡

slide-27
SLIDE 27

Summary ¡

  • Nebula: ¡new ¡cloud ¡architecture ¡

– Preserves ¡cloud ¡behavior: ¡APIs, ¡elasIcity, ¡ ¡transparency ¡ – Stronger ¡noIon ¡of ¡external ¡locality ¡ – Weaker ¡noIon ¡of ¡internal ¡locality ¡

  • Future ¡work ¡

– End-­‑to-­‑end ¡system ¡operaIonal ¡ – Connect ¡to ¡the ¡commercial ¡cloud ¡

¡ ¡“use ¡the ¡edge ¡opportunisIcally” ¡

slide-28
SLIDE 28

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡

¡ ¡ ¡ ¡Thank ¡you! ¡ ¡QuesIons? ¡