Simulation-time data analysis and I/O acceleration at extreme scale - - PowerPoint PPT Presentation

simulation time data analysis and i o acceleration at
SMART_READER_LITE
LIVE PREVIEW

Simulation-time data analysis and I/O acceleration at extreme scale - - PowerPoint PPT Presentation

Simulation-time data analysis and I/O acceleration at extreme scale with GLEAN Venkatram Vishwanath, Mark Hereld and Michael E. Papka Argonne Na<onal Laboratory venkatv@mcs.anl.gov


slide-1
SLIDE 1

Venkatram ¡ ¡Vishwanath, ¡Mark ¡Hereld ¡and ¡ Michael ¡E. ¡Papka ¡

Argonne ¡Na<onal ¡Laboratory ¡ venkatv@mcs.anl.gov ¡

Simulation-time data analysis and I/O acceleration at extreme scale with GLEAN

slide-2
SLIDE 2

Simulation-time Analysis Opportunities on the Argonne Leadership Computing Facility

We ¡need ¡to ¡perform ¡the ¡right ¡computa<on ¡ at ¡the ¡right ¡place ¡and ¡<me ¡taking ¡into ¡ account ¡the ¡characteris<cs ¡of ¡the ¡simula<on, ¡ resources ¡and ¡analysis ¡

2 ¡

40K ¡Nodes ¡ 160K ¡Cores ¡ 557 ¡TFlops ¡ 640 ¡ ¡I/O ¡ Nodes ¡ Myrinet ¡ Switch ¡ Complex ¡ 900+ ¡ ports ¡ 100 ¡Nodes ¡ 200 ¡GPUs ¡ 110 ¡TFlops ¡ 128 ¡File ¡ Servers ¡ 6.4 ¡ ¡ Tb/s ¡ 4.3 ¡Tb/s ¡ 1 ¡Tb/s ¡ 1.3 ¡Tb/s ¡ 0.5 ¡Tb/s ¡ Intrepid ¡BG/P ¡Compute ¡Resource ¡ Eureka ¡Analysis ¡Cluster ¡ Storage ¡System ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡

slide-3
SLIDE 3

Our approach - GLEAN

Simula<on ¡ View ¡ Compute ¡resource ¡ Analysis ¡Cluster ¡ Worksta<on ¡

Home ¡Ins-tu-on ¡ Supercompu-ng ¡Facility ¡

GLEAN ¡is ¡a ¡flexible ¡and ¡extensible ¡framework ¡for ¡simula<on-­‑<me ¡ data ¡analysis ¡and ¡I/O ¡accelera<on ¡taking ¡into ¡account ¡applica<on, ¡ analy<cs ¡and ¡system ¡characteris<cs ¡to ¡perform ¡the ¡right ¡analysis ¡ at ¡the ¡right ¡place ¡and ¡-me. ¡

Analysis ¡/ ¡Staging ¡

slide-4
SLIDE 4

Applica<on ¡ I/O ¡Library ¡ (hdf5, ¡pnetcdf) ¡ I/O ¡Network ¡ File ¡server ¡ Applica<on ¡ I/O ¡Library ¡ (hdf5, ¡pnetcdf) ¡ I/O ¡Network ¡ File ¡server ¡ GLEAN ¡ GLEAN ¡ Analysis/Staging ¡Nodes ¡

Tradi<onal ¡Mode ¡ Mode ¡with ¡GLEAN ¡

Compute ¡ Resource ¡ Analysis/Staging/Transforma<on ¡

slide-5
SLIDE 5

Key features of GLEAN

  • Exploit ¡the ¡underlying ¡network ¡topology ¡to ¡speed ¡data ¡

movement ¡

  • Leverage ¡data ¡seman<cs ¡of ¡applica<ons ¡
  • Provide ¡non-­‑intrusive ¡integra<on ¡with ¡exis<ng ¡applica<ons ¡ ¡
  • Enable ¡simula<on-­‑<me ¡data ¡analysis, ¡transforma<on ¡and ¡

reduc<on ¡by ¡providing ¡a ¡flexible ¡and ¡extensible ¡API ¡

  • Provide ¡asynchronous ¡data ¡I/O ¡via ¡staging ¡nodes ¡
  • Provide ¡transparent ¡integra<on ¡with ¡na<ve ¡applica<on ¡data ¡
  • formats. ¡ ¡
slide-6
SLIDE 6

Strong scaling performance to write 1GiB

By ¡leveraging ¡the ¡topology ¡of ¡BG/P, ¡we ¡can ¡achieve ¡both ¡ weak ¡scaling ¡as ¡well ¡as ¡strong ¡scaling ¡for ¡data ¡movement ¡

¡

“Topology-­‑aware ¡data ¡movement ¡and ¡staging ¡for ¡I/O ¡accelera<on ¡for ¡IBM ¡Blue ¡ Gene/P ¡supercompu<ng ¡applica<ons”, ¡V. ¡Vishwanath ¡et. ¡al. ¡(To ¡appear ¡SC ¡2011) ¡ ¡

slide-7
SLIDE 7

Performance for FLASH checkpoints

  • For ¡weak ¡scaling ¡at ¡32,768 ¡cores, ¡GLEAN ¡sustains ¡31 ¡GiBps ¡and ¡

achieves ¡an ¡observed ¡speedup ¡of ¡10-­‑fold ¡over ¡pnetcdf ¡and ¡hdf5 ¡

  • For ¡strong ¡scaling ¡at ¡32,768 ¡cores, ¡GLEAN ¡sustains ¡27 ¡GiBps ¡and ¡

achieves ¡an ¡observed ¡speedup ¡of ¡15-­‑fold ¡over ¡pnetcdf ¡and ¡hdf5 ¡

  • 16.3 ¡GiBps ¡to ¡Storage ¡at ¡32K ¡cores ¡
slide-8
SLIDE 8

in situ analysis of FLASH using GLEAN

Intrepid ¡Compute ¡Resource ¡

ALCF ¡Facility ¡

FLASH ¡ Analysis ¡

  • Fractal ¡Dimension ¡illustrates ¡

the ¡degree ¡of ¡turbulence ¡in ¡a ¡ par<cular ¡<me ¡step ¡as ¡well ¡as ¡ within ¡a ¡sub-­‑region ¡of ¡the ¡ domain ¡

  • Analysis ¡using ¡GLEAN ¡required ¡

no ¡code ¡changes ¡to ¡FLASH ¡

  • in ¡situ ¡analysis ¡to ¡compute ¡

fractal ¡dimension ¡for ¡5 ¡variables ¡

  • f ¡a ¡FLASH ¡simula<on ¡on ¡2048 ¡

BG/P ¡processors ¡ ¡

Analysis ¡

G L E A N ¡

14-­‑Fold ¡ improvement ¡

slide-9
SLIDE 9

Simulation-time analysis of PHASTA

  • n 160K Intrepid BG/P cores

¡Isosurface ¡of ¡ver<cal ¡velocity ¡colored ¡by ¡velocity ¡and ¡cut ¡plane ¡through ¡the ¡ synthe<c ¡jet ¡(both ¡on ¡3.3 ¡Billion ¡element ¡mesh). ¡Image ¡Courtesy: ¡Ken ¡Jansen ¡ ¡

  • Visualiza<on ¡of ¡a ¡PHASTA ¡simula<on ¡running ¡on ¡160K ¡cores ¡of ¡

Intrepid ¡using ¡ParaView ¡on ¡100 ¡Eureka ¡nodes ¡enabled ¡by ¡GLEAN ¡ ¡

  • GLEAN ¡achieves ¡48 ¡GiBps ¡sustained ¡throughput ¡for ¡data ¡

movement ¡enabling ¡simula<on-­‑<me ¡analysis ¡

slide-10
SLIDE 10

GLEAN- Enabling simulation-time data analysis and I/O acceleration

Infrastructure ¡ Simula-on ¡ Analysis ¡ ¡ Co-­‑analysis ¡ PHASTA ¡ Visualiza<on ¡using ¡ Paraview ¡ Staging ¡ FLASH, ¡S3D ¡ I/O ¡Accelera<on ¡ In ¡situ ¡ FLASH ¡ Fractal ¡Dimension, ¡ Surface ¡Area, ¡ Histograms ¡ In ¡flight ¡ MADBench2 ¡ Histogram ¡

  • A ¡flexible ¡and ¡extensible ¡data ¡analysis ¡framework ¡taking ¡into ¡account ¡

applica<on, ¡analy<cs ¡and ¡system ¡characteris<cs ¡to ¡perform ¡the ¡right ¡ analysis ¡at ¡the ¡right ¡place ¡and ¡-me ¡

  • Provides ¡I/O ¡accelera<on ¡by ¡asynchronous ¡data ¡staging ¡
  • Scaled ¡to ¡en-re ¡ALCF ¡infrastructure ¡(160K ¡BG/P ¡cores ¡+ ¡100 ¡Eureka ¡Nodes) ¡
  • Leverages ¡data ¡models ¡
  • f ¡applica<ons ¡

including ¡adap<ve ¡ mesh ¡refinement ¡and ¡ unstructured ¡meshes ¡

  • Generic ¡design ¡to ¡

enable ¡deployment ¡on ¡ any ¡plaeorm ¡ ¡

slide-11
SLIDE 11
  • DOE ¡Office ¡of ¡Advanced ¡Scien<fic ¡Compu<ng ¡Research ¡
  • ANL ¡Director’s ¡Fellow ¡Award ¡
  • Argonne ¡Leadership ¡Compu<ng ¡(ALCF) ¡Resources ¡ ¡
  • ANL ¡-­‑ ¡Mike ¡Papka, ¡Mark ¡Hereld, ¡Joseph ¡Insley, ¡Eric ¡Olson, ¡

Aaron ¡Knoll, ¡Tom ¡Uram, ¡Rob ¡Ross, ¡Tom ¡Peterka, ¡Rob ¡Latham, ¡ Phil ¡Carns, ¡Kevin ¡Harms, ¡Kamil ¡Iskra, ¡Vitali ¡Morozov, ¡Susan ¡ Coughlan, ¡Ray ¡Loy, ¡and ¡the ¡ALCF ¡team ¡

  • FLASH ¡Center ¡– ¡Chris ¡Daley, ¡George ¡Jordan, ¡Anshu ¡Dubey, ¡John ¡

Norris, ¡Randy ¡Hudson ¡and ¡Don ¡Lamb ¡

  • Kitware ¡-­‑ ¡Pat ¡Marion ¡and ¡Berk ¡Geveci ¡
  • PHASTA ¡– ¡Ken ¡Jansen, ¡Michel ¡Rasquin ¡and ¡the ¡PHASTA ¡team ¡

Acknowledgements

venkatv@mcs.anl.gov ¡

slide-12
SLIDE 12

Summary

  • Exploi<ng ¡topology, ¡data ¡seman<cs ¡and ¡

asynchronous ¡data ¡staging ¡is ¡cri<cal ¡as ¡we ¡scale ¡to ¡ future ¡systems ¡

  • GLEAN ¡is ¡a ¡flexible ¡and ¡extensible ¡framework ¡for ¡data ¡

analysis ¡and ¡I/O ¡accelera<on ¡taking ¡into ¡account ¡ applica<on, ¡analy<cs ¡and ¡system ¡characteris<cs ¡

  • Demonstrated ¡GLEAN ¡successfully ¡with ¡DOE ¡INCITE ¡

and ¡ESP ¡applica<ons ¡for ¡simula<on-­‑<me ¡data ¡analysis ¡ and ¡I/O ¡accelera<on ¡at ¡scale ¡on ¡leadership ¡compu<ng ¡ systems ¡ ¡

venkatv@mcs.anl.gov ¡