Outsourcing IT complexity Moving Ultraviz management from - - PowerPoint PPT Presentation

outsourcing it complexity
SMART_READER_LITE
LIVE PREVIEW

Outsourcing IT complexity Moving Ultraviz management from - - PowerPoint PPT Presentation

Outsourcing IT complexity Moving Ultraviz management from the laboratory to the cloud Ian Foster A story of modern science


slide-1
SLIDE 1

Outsourcing ¡IT ¡complexity ¡

Moving ¡Ultraviz ¡management ¡ from ¡the ¡laboratory ¡to ¡the ¡cloud ¡ ¡ Ian ¡Foster ¡

slide-2
SLIDE 2

2 ¡

A ¡story ¡of ¡modern ¡science ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Keith ¡Cheng: ¡map ¡genotypephenotype ¡for ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡~3000 ¡zebrafish ¡mutants ¡ ¡ ¡ ¡ ¡ ¡Collect, ¡move, ¡store, ¡ index, ¡analyze, ¡share, ¡ update, ¡millions ¡of ¡files ¡

¡

¡ ¡ ¡ ¡IT ¡complexity ¡greather ¡than ¡that ¡of ¡typical ¡enterprise ¡

Gordon ¡ Kindlmann ¡

slide-3
SLIDE 3

3 ¡

Sources ¡of ¡complexity ¡in ¡science ¡

  • Run ¡experiments ¡
  • Collect ¡data ¡
  • Manage ¡data ¡
  • Move ¡data ¡
  • Analyze ¡data ¡
  • Run ¡simulaJons ¡
  • Compare ¡experiment ¡ ¡

with ¡simulaJon ¡

  • Search ¡the ¡literature ¡
  • Share ¡results ¡
  • Communicate ¡with ¡

colleagues ¡

  • Publish ¡papers ¡
  • Find, ¡configure, ¡install ¡

relevant ¡soNware ¡

  • Find, ¡access, ¡analyze ¡

relevant ¡data ¡

  • Document ¡research ¡
  • Order ¡supplies ¡
slide-4
SLIDE 4

4 ¡

Outsourcing ¡complexity ¡in ¡business ¡

  • Web ¡presence ¡
  • Email ¡(hosted ¡Exchange) ¡
  • Calendar ¡
  • Telephony ¡(hosted ¡VOIP) ¡
  • Human ¡resources ¡and ¡payroll ¡
  • AccounJng ¡
  • Customer ¡relaJonship ¡mgmt ¡

SoNware ¡ ¡ as ¡ ¡ a ¡ Service ¡

(SaaS) ¡

slide-5
SLIDE 5

5 ¡

Outsourcing ¡complexity ¡in ¡business ¡

  • Web ¡presence ¡
  • Email ¡(hosted ¡Exchange) ¡
  • Calendar ¡
  • Telephony ¡(hosted ¡VOIP) ¡
  • Human ¡resources ¡and ¡payroll ¡
  • AccounJng ¡
  • Customer ¡relaJonship ¡mgmt ¡
  • Data ¡analyJcs ¡
  • Content ¡distribuJon ¡
  • … ¡

SoNware ¡ ¡ as ¡ ¡ a ¡ Service ¡

(SaaS) ¡

PlaYorm/ ¡ Infrastructure ¡ as ¡a ¡Service ¡

(PaaS/IaaS) ¡

slide-6
SLIDE 6

6 ¡

Outsourcing ¡complexity ¡in ¡science ¡

  • Run ¡experiments ¡
  • Collect ¡data ¡
  • Manage ¡data ¡
  • Move ¡data ¡
  • Analyze ¡data ¡
  • Run ¡simulaJons ¡
  • Compare ¡experiment ¡ ¡

with ¡simulaJon ¡

  • Search ¡the ¡literature ¡
  • Share ¡results ¡
  • Communicate ¡with ¡

colleagues ¡

  • Publish ¡papers ¡
  • Find, ¡configure, ¡install ¡

relevant ¡soNware ¡

  • Find, ¡access, ¡analyze ¡

relevant ¡data ¡

  • Document ¡research ¡
  • Order ¡supplies ¡

Globus ¡Online ¡= ¡Sci-­‑SaaS ¡

slide-7
SLIDE 7

7 ¡

A ¡nuclear ¡physicist ¡sharing ¡data ¡

  • Hai ¡Ah ¡Nam, ¡a ¡nuclear ¡physicist ¡from ¡Oak ¡Ridge ¡

spoke ¡at ¡GlobusWorld ¡March ¡2010 ¡about ¡the ¡ struggles ¡with ¡moving ¡data ¡

  • Transferring ¡1.6 ¡TB ¡(86 ¡large ¡files) ¡from ¡Oak ¡

Ridge ¡to ¡NERSC ¡

  • Changed ¡from ¡using ¡scp ¡to ¡GridFTP ¡to ¡reduce ¡

transfer ¡from ¡days ¡to ¡hours ¡

  • Reduced ¡transferring ¡137 ¡TB ¡from ¡months ¡to ¡

days ¡

  • But, ¡it ¡was ¡not ¡easy... ¡
slide-8
SLIDE 8

8 ¡

Data ¡movement ¡is ¡hard ¡

For ¡many ¡reasons ¡

  • SCP ¡is ¡too ¡slow ¡
  • No ¡GridFTP ¡at ¡site ¡
  • Firewalls ¡
  • Space ¡management ¡
  • Net ¡(mis)configuraJon ¡
  • Security ¡config, ¡policies ¡
  • Other ¡heterogeneiJes ¡
  • Failures, ¡restarts, ¡

mirroring, ¡other ¡tasks ¡

For ¡many ¡people ¡

  • Ad-­‑hoc: ¡Non-­‑experts ¡

who ¡need ¡to ¡move ¡ many ¡files ¡

  • Scripted: ¡Experts ¡who ¡

want ¡to ¡automate ¡large ¡ file ¡movement ¡

  • System ¡builders: ¡Don’t ¡

want ¡to ¡re-­‑engineer ¡ soluJons ¡to ¡such ¡ problems ¡

slide-9
SLIDE 9

9 ¡

Globus ¡Online: ¡A ¡“Web ¡2.0” ¡soluJon ¡

  • Outsource ¡the ¡mundane ¡

– Manage ¡site ¡configuraJons, ¡

credenJals, ¡network ¡ configuraJons, ¡… ¡

– Monitor ¡transfers ¡

  • Automate ¡the ¡repeJJve ¡

– Retry ¡failed ¡transfers, ¡mirror ¡

directories, ¡… ¡

  • Radically ¡simplify ¡interfaces ¡

– REST ¡ – CLI ¡2.0 ¡(including ¡scp) ¡

9 ¡

Data Data

Globus Online

Data Data

slide-10
SLIDE 10

10 ¡

Globus ¡Online ¡and ¡that ¡“cloud” ¡thing ¡

Software-as-a-Service (SaaS) Platform-as-a-Service (PaaS) Infrastructure-as-a-Service (IaaS)

slide-11
SLIDE 11

11 ¡

Applying ¡Web ¡2.0/SaaS ¡methods ¡

  • Service: ¡Built ¡as ¡scale-­‑out ¡web ¡applicaJon ¡

– Hosted ¡on ¡Amazon ¡Web ¡Services ¡

  • Client: ¡Minimize ¡soNware ¡deployment ¡

– Web ¡2.0 ¡

  • AJAX ¡+ ¡REST ¡
  • NoJficaJon ¡via ¡email, ¡IM, ¡SMS, ¡Twimer, ¡etc. ¡
  • Enable ¡mash-­‑ups ¡

– “CLI ¡2.0” ¡

  • ssh ¡cli.globus.org ¡… ¡

– Support ¡for ¡heterogeneity ¡in ¡end ¡systems: ¡data ¡

transfer ¡and ¡security ¡protocols, ¡etc. ¡

slide-12
SLIDE 12

12 ¡

Why ¡SaaS? ¡

  • Requires ¡no ¡user ¡soNware ¡installaJon ¡

– Minimal ¡IT ¡proficiency ¡required ¡

  • Efficient ¡soNware ¡delivery ¡lifecycle ¡

– Updates ¡developed, ¡tested ¡and ¡deployed ¡quickly ¡

  • Consolidated ¡troubleshooJng ¡and ¡support ¡

– An ¡expert ¡group ¡can ¡proacJvely ¡detect ¡and ¡correct ¡

problems ¡

– Partnering ¡with ¡Argonne/UC ¡IT ¡support ¡group ¡who ¡

specialize ¡in ¡support ¡and ¡ops ¡

slide-13
SLIDE 13

13 ¡

The ¡Globus.org ¡user ¡can ¡… ¡

  • Register ¡with ¡Globus ¡Online ¡
  • Update ¡their ¡profile ¡
  • Define ¡endpoints ¡that ¡can ¡

then ¡be ¡acEvated ¡ ¡

  • Transfer ¡data ¡between ¡

endpoints—creaJng ¡a ¡task ¡

  • Monitor ¡status ¡of ¡task(s) ¡
  • View ¡event(s) ¡for ¡task(s) ¡

Globus Online

Data Data

slide-14
SLIDE 14

14 ¡

Globus ¡Online ¡interfaces ¡

  • CLI ¡

– ssh ¡ME@cli.globusonline.org ¡COMMAND ¡

  • REST ¡

– Same ¡thing, ¡but ¡in ¡HTTP ¡packets ¡

  • GUIs ¡

– As ¡with ¡any ¡Web ¡2.0 ¡system, ¡a ¡variety ¡of ¡graphical ¡

interfaces ¡can ¡be ¡created ¡easily, ¡using ¡Ajax ¡and ¡

  • ther ¡technologies ¡
slide-15
SLIDE 15

15 ¡

Parts ¡of ¡the ¡CLI ¡Command ¡

slide-16
SLIDE 16

16 ¡

A ¡peek ¡inside ¡Globus ¡Online ¡

GridFTP GridFTP

Data ¡ store ¡ Consumer ¡ Consumer ¡ Consumer ¡ Consumer ¡ Request ¡ collector ¡

Notification target

Worker ¡ Worker ¡ Worker ¡ Worker ¡ Worker ¡

slide-17
SLIDE 17

17 ¡

Engaging ¡scp ¡users ¡

  • 100s ¡of ¡NERSC ¡users ¡transfer ¡large ¡amounts ¡(>20 ¡

GB) ¡of ¡data ¡to/from ¡NERSC ¡with ¡scp ¡

  • Globus ¡Online ¡scp ¡opJon ¡provides ¡higher ¡

performance ¡and ¡reliability ¡… ¡with ¡simplicity ¡ ¡

  • f ¡scp ¡command ¡
  • Extra ¡benefits ¡

– Detached ¡transfer: ¡async, ¡fire ¡and ¡forget ¡ – AutomaJc ¡recovery ¡from ¡network, ¡end-­‑system ¡failures ¡ – Load ¡balancing ¡& ¡fail-­‑over ¡ – End-­‑to-­‑end ¡verificaJon, ¡sync, ¡… ¡

slide-18
SLIDE 18

18 ¡

The ¡simple ¡scp ¡command ¡

slide-19
SLIDE 19
slide-20
SLIDE 20

20 ¡

Globus.org ¡

20 ¡

>100K files 200 MB each 11 users 12 sites

slide-21
SLIDE 21

21 ¡

Example ¡scripted ¡user: ¡Climate ¡science ¡

  • Chan ¡Wilson ¡(GFDL): ¡a ¡sys ¡admin ¡/ ¡script ¡ ¡

developer ¡for ¡a ¡group ¡of ¡climate ¡scienJsts ¡

  • CreaJng ¡automaJon ¡scripts ¡for ¡sustaining ¡ ¡

80TB ¡/ ¡day ¡of ¡simulaJon ¡output ¡from ¡remote ¡ supercomputers ¡to ¡GFDL ¡

  • ESnet ¡w/ ¡striped ¡GridFTP ¡endpoints ¡

– 12 ¡DTN/GridFTP ¡servers ¡amached ¡to ¡GFDL ¡cluster ¡

filesystem ¡

  • He ¡is ¡counJng ¡on ¡Globus ¡Online ¡to ¡help ¡him ¡move ¡

that ¡data ¡reliably ¡with ¡required ¡performance ¡

slide-22
SLIDE 22

22 ¡

Example ¡system ¡builder: ¡HTC ¡integraJon ¡

  • Condor ¡supports ¡file ¡stage-­‑in/out ¡for ¡each ¡job ¡
  • Condor ¡is ¡adding ¡support ¡for ¡Globus.org ¡for ¡

staging ¡files ¡to/from ¡compute ¡hosts ¡to ¡off-­‑site ¡ locaJons ¡

  • Will ¡be ¡available ¡in ¡version ¡7.6.0 ¡(~Nov ¡2010) ¡
slide-23
SLIDE 23

23 ¡

Coming ¡soon ¡

  • Lightweight ¡transfer ¡agent ¡(firewalls, ¡sites ¡

without ¡GridFTP ¡installed) ¡

  • Group ¡management ¡
  • Higher-­‑level ¡data ¡management ¡capabiliJes ¡

– E.g., ¡data ¡publicaJon, ¡replicaJon ¡

  • ComputaJon ¡management ¡

– E.g., ¡SwiN ¡computaJons ¡

¡

slide-24
SLIDE 24

24 ¡

Other ¡Sci-­‑SaaS ¡services ¡planned ¡ ¡

  • VO ¡management ¡

– Groups, ¡membership, ¡ ¡

policies ¡(via ¡Grouper) ¡

  • ComputaJon ¡mgmt ¡

– Run ¡this ¡computaJon ¡ – Analyze ¡any ¡files ¡

deposited ¡in ¡directory ¡

  • Data ¡management ¡

– Storage ¡and ¡indexing ¡ – Archiving ¡and ¡lifecycle ¡ – PublicaJon ¡and ¡sharing ¡

¡

  • Workflow ¡management ¡

– Data ¡ingest ¡and ¡analysis ¡

pipelines ¡

  • Meta-­‑computaJons ¡

– Uncertainty ¡

quanJficaJon ¡

– OpJmizaJon ¡

Looking ¡for ¡partners ¡to, ¡e.g. ¡

  • ­‑ ¡Expand ¡set ¡of ¡services ¡
  • ­‑ ¡Host ¡services ¡in ¡other ¡ ¡

¡ ¡ ¡geographies ¡

slide-25
SLIDE 25

25 ¡

Acknowledgements ¡

Numerous ¡people ¡have ¡contributed ¡to ¡this ¡work, ¡ including: ¡

¡ ¡ ¡Bryce ¡Allen, ¡Joshua ¡Boverhof, ¡John ¡Bresnahan, ¡ ¡ Lisa ¡Childers, ¡Paul ¡Dave’, ¡Fred ¡Dech, ¡Ian ¡Foster, ¡ ¡ Dan ¡Gunter, ¡Gopi ¡Kandaswany, ¡Nick ¡Karonis, ¡ ¡ Raj ¡Kexmuthu, ¡Jack ¡Kordas, ¡Lee ¡Liming, ¡Mike ¡Link, ¡ Stu ¡MarJn, ¡JP ¡Navarro, ¡Karl ¡Pickem, ¡Mei ¡Hui ¡Su, ¡ Steve ¡Tuecke, ¡Vas ¡Vasiliadis ¡

Funders ¡

– DOE ¡and ¡NSF ¡

slide-26
SLIDE 26

26 ¡