SLIDE 1
Venkatram ¡ ¡Vishwanath, ¡Mark ¡Hereld ¡and ¡ Michael ¡E. ¡Papka ¡
Argonne ¡Na<onal ¡Laboratory ¡ venkatv@mcs.anl.gov ¡
Simulation-time data analysis and I/O acceleration at extreme scale with GLEAN
SLIDE 2 Simulation-time Analysis Opportunities on the Argonne Leadership Computing Facility
We ¡need ¡to ¡perform ¡the ¡right ¡computa<on ¡ at ¡the ¡right ¡place ¡and ¡<me ¡taking ¡into ¡ account ¡the ¡characteris<cs ¡of ¡the ¡simula<on, ¡ resources ¡and ¡analysis ¡
2 ¡
40K ¡Nodes ¡ 160K ¡Cores ¡ 557 ¡TFlops ¡ 640 ¡ ¡I/O ¡ Nodes ¡ Myrinet ¡ Switch ¡ Complex ¡ 900+ ¡ ports ¡ 100 ¡Nodes ¡ 200 ¡GPUs ¡ 110 ¡TFlops ¡ 128 ¡File ¡ Servers ¡ 6.4 ¡ ¡ Tb/s ¡ 4.3 ¡Tb/s ¡ 1 ¡Tb/s ¡ 1.3 ¡Tb/s ¡ 0.5 ¡Tb/s ¡ Intrepid ¡BG/P ¡Compute ¡Resource ¡ Eureka ¡Analysis ¡Cluster ¡ Storage ¡System ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡
SLIDE 3
Our approach - GLEAN
Simula<on ¡ View ¡ Compute ¡resource ¡ Analysis ¡Cluster ¡ Worksta<on ¡
Home ¡Ins-tu-on ¡ Supercompu-ng ¡Facility ¡
GLEAN ¡is ¡a ¡flexible ¡and ¡extensible ¡framework ¡for ¡simula<on-‑<me ¡ data ¡analysis ¡and ¡I/O ¡accelera<on ¡taking ¡into ¡account ¡applica<on, ¡ analy<cs ¡and ¡system ¡characteris<cs ¡to ¡perform ¡the ¡right ¡analysis ¡ at ¡the ¡right ¡place ¡and ¡-me. ¡
Analysis ¡/ ¡Staging ¡
SLIDE 4
Applica<on ¡ I/O ¡Library ¡ (hdf5, ¡pnetcdf) ¡ I/O ¡Network ¡ File ¡server ¡ Applica<on ¡ I/O ¡Library ¡ (hdf5, ¡pnetcdf) ¡ I/O ¡Network ¡ File ¡server ¡ GLEAN ¡ GLEAN ¡ Analysis/Staging ¡Nodes ¡
Tradi<onal ¡Mode ¡ Mode ¡with ¡GLEAN ¡
Compute ¡ Resource ¡ Analysis/Staging/Transforma<on ¡
SLIDE 5 Key features of GLEAN
- Exploit ¡the ¡underlying ¡network ¡topology ¡to ¡speed ¡data ¡
movement ¡
- Leverage ¡data ¡seman<cs ¡of ¡applica<ons ¡
- Provide ¡non-‑intrusive ¡integra<on ¡with ¡exis<ng ¡applica<ons ¡ ¡
- Enable ¡simula<on-‑<me ¡data ¡analysis, ¡transforma<on ¡and ¡
reduc<on ¡by ¡providing ¡a ¡flexible ¡and ¡extensible ¡API ¡
- Provide ¡asynchronous ¡data ¡I/O ¡via ¡staging ¡nodes ¡
- Provide ¡transparent ¡integra<on ¡with ¡na<ve ¡applica<on ¡data ¡
- formats. ¡ ¡
SLIDE 6
Strong scaling performance to write 1GiB
By ¡leveraging ¡the ¡topology ¡of ¡BG/P, ¡we ¡can ¡achieve ¡both ¡ weak ¡scaling ¡as ¡well ¡as ¡strong ¡scaling ¡for ¡data ¡movement ¡
¡
“Topology-‑aware ¡data ¡movement ¡and ¡staging ¡for ¡I/O ¡accelera<on ¡for ¡IBM ¡Blue ¡ Gene/P ¡supercompu<ng ¡applica<ons”, ¡V. ¡Vishwanath ¡et. ¡al. ¡(To ¡appear ¡SC ¡2011) ¡ ¡
SLIDE 7 Performance for FLASH checkpoints
- For ¡weak ¡scaling ¡at ¡32,768 ¡cores, ¡GLEAN ¡sustains ¡31 ¡GiBps ¡and ¡
achieves ¡an ¡observed ¡speedup ¡of ¡10-‑fold ¡over ¡pnetcdf ¡and ¡hdf5 ¡
- For ¡strong ¡scaling ¡at ¡32,768 ¡cores, ¡GLEAN ¡sustains ¡27 ¡GiBps ¡and ¡
achieves ¡an ¡observed ¡speedup ¡of ¡15-‑fold ¡over ¡pnetcdf ¡and ¡hdf5 ¡
- 16.3 ¡GiBps ¡to ¡Storage ¡at ¡32K ¡cores ¡
SLIDE 8 in situ analysis of FLASH using GLEAN
Intrepid ¡Compute ¡Resource ¡
ALCF ¡Facility ¡
FLASH ¡ Analysis ¡
- Fractal ¡Dimension ¡illustrates ¡
the ¡degree ¡of ¡turbulence ¡in ¡a ¡ par<cular ¡<me ¡step ¡as ¡well ¡as ¡ within ¡a ¡sub-‑region ¡of ¡the ¡ domain ¡
- Analysis ¡using ¡GLEAN ¡required ¡
no ¡code ¡changes ¡to ¡FLASH ¡
- in ¡situ ¡analysis ¡to ¡compute ¡
fractal ¡dimension ¡for ¡5 ¡variables ¡
- f ¡a ¡FLASH ¡simula<on ¡on ¡2048 ¡
BG/P ¡processors ¡ ¡
Analysis ¡
G L E A N ¡
14-‑Fold ¡ improvement ¡
SLIDE 9 Simulation-time analysis of PHASTA
- n 160K Intrepid BG/P cores
¡Isosurface ¡of ¡ver<cal ¡velocity ¡colored ¡by ¡velocity ¡and ¡cut ¡plane ¡through ¡the ¡ synthe<c ¡jet ¡(both ¡on ¡3.3 ¡Billion ¡element ¡mesh). ¡Image ¡Courtesy: ¡Ken ¡Jansen ¡ ¡
- Visualiza<on ¡of ¡a ¡PHASTA ¡simula<on ¡running ¡on ¡160K ¡cores ¡of ¡
Intrepid ¡using ¡ParaView ¡on ¡100 ¡Eureka ¡nodes ¡enabled ¡by ¡GLEAN ¡ ¡
- GLEAN ¡achieves ¡48 ¡GiBps ¡sustained ¡throughput ¡for ¡data ¡
movement ¡enabling ¡simula<on-‑<me ¡analysis ¡
SLIDE 10 GLEAN- Enabling simulation-time data analysis and I/O acceleration
Infrastructure ¡ Simula-on ¡ Analysis ¡ ¡ Co-‑analysis ¡ PHASTA ¡ Visualiza<on ¡using ¡ Paraview ¡ Staging ¡ FLASH, ¡S3D ¡ I/O ¡Accelera<on ¡ In ¡situ ¡ FLASH ¡ Fractal ¡Dimension, ¡ Surface ¡Area, ¡ Histograms ¡ In ¡flight ¡ MADBench2 ¡ Histogram ¡
- A ¡flexible ¡and ¡extensible ¡data ¡analysis ¡framework ¡taking ¡into ¡account ¡
applica<on, ¡analy<cs ¡and ¡system ¡characteris<cs ¡to ¡perform ¡the ¡right ¡ analysis ¡at ¡the ¡right ¡place ¡and ¡-me ¡
- Provides ¡I/O ¡accelera<on ¡by ¡asynchronous ¡data ¡staging ¡
- Scaled ¡to ¡en-re ¡ALCF ¡infrastructure ¡(160K ¡BG/P ¡cores ¡+ ¡100 ¡Eureka ¡Nodes) ¡
- Leverages ¡data ¡models ¡
- f ¡applica<ons ¡
including ¡adap<ve ¡ mesh ¡refinement ¡and ¡ unstructured ¡meshes ¡
enable ¡deployment ¡on ¡ any ¡plaeorm ¡ ¡
SLIDE 11
- DOE ¡Office ¡of ¡Advanced ¡Scien<fic ¡Compu<ng ¡Research ¡
- ANL ¡Director’s ¡Fellow ¡Award ¡
- Argonne ¡Leadership ¡Compu<ng ¡(ALCF) ¡Resources ¡ ¡
- ANL ¡-‑ ¡Mike ¡Papka, ¡Mark ¡Hereld, ¡Joseph ¡Insley, ¡Eric ¡Olson, ¡
Aaron ¡Knoll, ¡Tom ¡Uram, ¡Rob ¡Ross, ¡Tom ¡Peterka, ¡Rob ¡Latham, ¡ Phil ¡Carns, ¡Kevin ¡Harms, ¡Kamil ¡Iskra, ¡Vitali ¡Morozov, ¡Susan ¡ Coughlan, ¡Ray ¡Loy, ¡and ¡the ¡ALCF ¡team ¡
- FLASH ¡Center ¡– ¡Chris ¡Daley, ¡George ¡Jordan, ¡Anshu ¡Dubey, ¡John ¡
Norris, ¡Randy ¡Hudson ¡and ¡Don ¡Lamb ¡
- Kitware ¡-‑ ¡Pat ¡Marion ¡and ¡Berk ¡Geveci ¡
- PHASTA ¡– ¡Ken ¡Jansen, ¡Michel ¡Rasquin ¡and ¡the ¡PHASTA ¡team ¡
Acknowledgements
venkatv@mcs.anl.gov ¡
SLIDE 12 Summary
- Exploi<ng ¡topology, ¡data ¡seman<cs ¡and ¡
asynchronous ¡data ¡staging ¡is ¡cri<cal ¡as ¡we ¡scale ¡to ¡ future ¡systems ¡
- GLEAN ¡is ¡a ¡flexible ¡and ¡extensible ¡framework ¡for ¡data ¡
analysis ¡and ¡I/O ¡accelera<on ¡taking ¡into ¡account ¡ applica<on, ¡analy<cs ¡and ¡system ¡characteris<cs ¡
- Demonstrated ¡GLEAN ¡successfully ¡with ¡DOE ¡INCITE ¡
and ¡ESP ¡applica<ons ¡for ¡simula<on-‑<me ¡data ¡analysis ¡ and ¡I/O ¡accelera<on ¡at ¡scale ¡on ¡leadership ¡compu<ng ¡ systems ¡ ¡
venkatv@mcs.anl.gov ¡