The Purge Threat : Scien*sts thoughts on peta-scale - - PowerPoint PPT Presentation

the purge threat scien sts thoughts on peta scale
SMART_READER_LITE
LIVE PREVIEW

The Purge Threat : Scien*sts thoughts on peta-scale - - PowerPoint PPT Presentation

The Purge Threat : Scien*sts thoughts on peta-scale usability Alexandra Holloway <fire@soe.ucsc.edu> Storage Systems Research Center + Assis*ve Technology


slide-1
SLIDE 1

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

The ¡Purge ¡Threat: ¡Scien*sts’ ¡ thoughts ¡on ¡peta-­‑scale ¡usability ¡

Alexandra ¡Holloway ¡<fire@soe.ucsc.edu> ¡ Storage ¡Systems ¡Research ¡Center ¡+ ¡Assis*ve ¡Technology ¡Lab ¡ University ¡of ¡California, ¡Santa ¡Cruz ¡

slide-2
SLIDE 2

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Introduc*on ¡

  • Usability ¡problems, ¡including ¡media*ng ¡the ¡

threat ¡of ¡data ¡loss ¡when ¡parallel ¡file ¡system ¡ fills ¡up ¡

– The ¡Purge ¡Threat ¡

  • Discussion ¡of ¡a ¡usability ¡problem ¡

– Interview ¡data ¡ – Not ¡a ¡solu*on ¡

slide-3
SLIDE 3

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Research ¡ques*ons ¡

  • RQ1. ¡ ¡How ¡do ¡par*cipants ¡interact ¡with ¡the ¡

file ¡system ¡currently? ¡

  • RQ2. ¡ ¡What ¡are ¡the ¡biggest ¡usability ¡problems ¡

concerning ¡the ¡peta-­‑scale ¡file ¡system? ¡

  • RQ3. ¡ ¡How ¡do ¡scien*sts ¡address ¡the ¡major ¡

usability ¡concerns? ¡

slide-4
SLIDE 4

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • Los ¡Alamos ¡Na*onal ¡Lab: ¡ ¡

13 ¡par*cipants ¡(10 ¡groups) ¡

  • Lawrence ¡Livermore ¡Na*onal ¡

Laboratory: ¡4 ¡par*cipants ¡

  • Developers: ¡2 ¡

Users: ¡11 ¡ Mixed ¡roles: ¡2 ¡ Other ¡roles: ¡2 ¡

  • Men: ¡16 ¡

Women: ¡1 ¡

Par*cipants ¡

slide-5
SLIDE 5

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • Parallel ¡system ¡
  • NFS ¡
  • Local ¡machine ¡
  • Archival ¡storage ¡(tape) ¡

System ¡

slide-6
SLIDE 6

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

The ¡problem ¡

  • Scien*sts ¡generate ¡poten*ally ¡thousands ¡of ¡

files ¡per ¡job ¡

slide-7
SLIDE 7

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • Produc*ve ¡I/O ¡

– Data ¡the ¡user ¡needs ¡to ¡ perform ¡analyses ¡and ¡draw ¡ conclusions ¡ – E.g., ¡Visualiza*on ¡dumps ¡ ¡

  • Defensive ¡I/O ¡

– Data ¡the ¡user ¡needs ¡to ¡show ¡ proof ¡that ¡results ¡were ¡

  • btained ¡determinis*cally ¡

– E.g., ¡Restart ¡files, ¡*me ¡ histories, ¡parallel ¡output ¡ data ¡

Where ¡do ¡files ¡come ¡from? ¡

Visualiza*on ¡dump ¡ size: ¡1—10% ¡× ¡ restart ¡files ¡

slide-8
SLIDE 8

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • File ¡system ¡fills ¡up ¡

What ¡happens ¡to ¡all ¡these ¡files? ¡

slide-9
SLIDE 9

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

The ¡Purge ¡Threat ¡

  • Least ¡recently ¡accessed ¡files ¡scheduled ¡for ¡

dele*on ¡

  • List ¡of ¡affected ¡files ¡published ¡
  • Affected ¡users ¡must ¡decide: ¡

– Archive ¡ – Delete ¡(or ¡allow ¡dele*on) ¡

  • Purge ¡threat ¡is ¡the ¡threat ¡of ¡data ¡loss ¡
slide-10
SLIDE 10

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • 1. ¡Run ¡simula*on ¡or ¡job, ¡

crea*ng ¡10000+ ¡files. ¡

Ideal ¡file ¡life ¡cycle ¡

1 ¡

slide-11
SLIDE 11

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • 2. ¡Import ¡select ¡results ¡for ¡

processing ¡and ¡ visualiza*on. ¡

Ideal ¡file ¡life ¡cycle ¡

2 ¡ 1 ¡

slide-12
SLIDE 12

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • 3. ¡Think ¡about ¡which ¡data ¡

are ¡important ¡to ¡save. ¡

Ideal ¡file ¡life ¡cycle ¡

3 … ¡

slide-13
SLIDE 13

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • 4. ¡Archive ¡important ¡data. ¡

Ideal ¡file ¡life ¡cycle ¡

4 4 ¡

slide-14
SLIDE 14

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Ideal ¡file ¡life ¡cycle ¡

  • Ideal ¡file ¡life ¡cycle ¡only ¡happened ¡1 ¡in ¡17 ¡

par*cipants ¡

  • What ¡did ¡the ¡other ¡16 ¡do? ¡
slide-15
SLIDE 15

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Addressing ¡the ¡purge ¡threat ¡

  • Three ¡ways ¡to ¡address ¡the ¡purge ¡threat: ¡
  • 1. Analysis ¡
  • 2. Automa*on ¡
  • 3. Subversion ¡
  • Interes*ngly, ¡nobody ¡named: ¡
  • 4. Do ¡nothing ¡and ¡let ¡files ¡perish ¡
slide-16
SLIDE 16

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Analysis ¡

  • Think ¡about ¡affected ¡

files ¡and ¡move ¡them ¡to ¡ tape ¡manually. ¡

  • (The ¡ideal ¡file ¡life ¡cycle) ¡
slide-17
SLIDE 17

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Automa*on ¡

  • Write ¡a ¡script ¡to ¡move ¡

all ¡affected ¡files ¡ automa*cally. ¡

slide-18
SLIDE 18

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Subversion ¡

  • Refresh ¡the ¡access ¡date ¡
  • n ¡files ¡using ¡touch. ¡
slide-19
SLIDE 19

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Reasons ¡to ¡keep ¡data ¡

  • Parallel ¡file ¡system ¡is ¡not ¡backed ¡up ¡

– Save ¡data ¡in ¡case ¡of ¡a ¡system ¡crash ¡

  • Save ¡all ¡data ¡that ¡led ¡to ¡a ¡decision ¡

– Reproduce ¡determinis*cally ¡even ¡years ¡later ¡

slide-20
SLIDE 20

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Purge ¡threat ¡in ¡the ¡work ¡flow ¡

slide-21
SLIDE 21

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

  • Cau*onary ¡archiving ¡

– Protect ¡against ¡ unan*cipated ¡data ¡loss ¡ (e.g., ¡crash) ¡

  • Reac*onary ¡archiving ¡

– Protect ¡against ¡purge ¡ threat ¡and ¡scheduled ¡ purge ¡

Two ¡archiving ¡methods ¡

slide-22
SLIDE 22

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Why ¡not ¡just ¡archive ¡everything? ¡

  • Archiving ¡is ¡“real ¡money ¡in ¡tapes.” ¡
  • 90% ¡of ¡archive ¡is ¡never ¡read ¡– ¡“Write ¡Once, ¡

Read ¡Never.” ¡ ¡

  • Retrieval ¡is ¡painstakingly ¡slow. ¡
  • Archiving ¡has ¡huge ¡cogni*ve ¡load. ¡
slide-23
SLIDE 23

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Deciding ¡to ¡archive ¡

slide-24
SLIDE 24

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

What ¡happens ¡next? ¡

The ¡next ¡genera*on ¡[of ¡scale] ¡ may ¡be ¡the ¡breaking ¡point ¡from ¡ “barely ¡doable” ¡to ¡“what ¡do ¡we ¡ do ¡next?” ¡

slide-25
SLIDE 25

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Usability ¡problems ¡

  • User ¡must ¡retrieve ¡the ¡list ¡
  • User ¡may ¡not ¡understand ¡seriousness ¡
  • User ¡may ¡not ¡understand ¡scope ¡
slide-26
SLIDE 26

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Proposed ¡solu*ons ¡

  • Bopleneck ¡is ¡walking ¡the ¡directory ¡structure ¡
  • Time-­‑oriented ¡file ¡representa*on ¡
  • Space-­‑oriented ¡file ¡representa*on ¡
slide-27
SLIDE 27

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Time-­‑oriented ¡file ¡representa*on ¡

  • Files ¡in ¡last-­‑accessed ¡chronological ¡order ¡
  • Appropriate ¡granularity ¡

– dump.1, ¡dump.2, ¡etc. ¡represented ¡as ¡ ¡ dump.[1—256]

  • Threatened ¡files ¡listed ¡
slide-28
SLIDE 28

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

[user@sys %] lst --week Accessed this week: project1/vars/dump.[1–256] project1/vars/restart.time[112988–98]

Time-­‑oriented ¡file ¡representa*on ¡

Requires ¡ apen*on ¡

slide-29
SLIDE 29

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Space-­‑oriented ¡file ¡representa*on ¡

  • Removing ¡the ¡largest ¡size ¡may ¡mediate ¡the ¡

purge ¡threat ¡

  • How ¡far ¡down ¡the ¡directory ¡structure ¡is ¡the ¡

first ¡file ¡of ¡a ¡par*cular ¡size? ¡

slide-30
SLIDE 30

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Research ¡ques*ons ¡

  • RQ1. ¡ ¡How ¡do ¡par*cipants ¡interact ¡with ¡the ¡

file ¡system ¡currently? ¡

  • Command ¡line ¡
  • RQ2. ¡ ¡What ¡are ¡the ¡biggest ¡usability ¡problems ¡

concerning ¡the ¡peta-­‑scale ¡file ¡system? ¡

  • Decision-­‑making ¡and ¡usability ¡surrounding ¡purge ¡
  • RQ3. ¡ ¡How ¡do ¡scien*sts ¡address ¡the ¡major ¡

usability ¡concerns? ¡

  • Analysis, ¡automa*on, ¡and ¡subversion ¡
slide-31
SLIDE 31

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Conclusions ¡

  • Purge ¡threat ¡
  • Addressing ¡the ¡purge ¡threat ¡does ¡not ¡meet ¡

usability ¡demands ¡

  • Decision-­‑making ¡paradigms ¡surrounding ¡

archiving: ¡reac*onary ¡and ¡cau*onary ¡

  • Three ¡reasons ¡for ¡poor ¡usability ¡
  • Proposed ¡interfaces ¡
slide-32
SLIDE 32

6th PDSW - November 13, 2011 The Purge Threat @ SSRC + ATL - University of California, Santa Cruz

Ques*ons? ¡

  • The ¡Purge ¡Threat: ¡Scien*sts’ ¡thoughts ¡on ¡

peta-­‑scale ¡usability ¡

Alexandra ¡Holloway ¡<fire@soe.ucsc.edu> ¡ Storage ¡Systems ¡Research ¡Center ¡+ ¡Assis*ve ¡Technology ¡Lab ¡ University ¡of ¡California, ¡Santa ¡Cruz ¡