Visualiza(on of Memory Performance Paul Rosen Research - - PowerPoint PPT Presentation

visualiza on of memory performance
SMART_READER_LITE
LIVE PREVIEW

Visualiza(on of Memory Performance Paul Rosen Research - - PowerPoint PPT Presentation

Visualiza(on of Memory Performance Paul Rosen Research Assistant Professor Scien(fic Compu(ng and Imaging Ins(tute School of Compu(ng University of Utah High


slide-1
SLIDE 1

Visualiza(on ¡of ¡Memory ¡Performance ¡

Paul ¡Rosen ¡ Research ¡Assistant ¡Professor ¡ Scien(fic ¡Compu(ng ¡and ¡Imaging ¡Ins(tute ¡ School ¡of ¡Compu(ng ¡ University ¡of ¡Utah ¡

slide-2
SLIDE 2

High ¡Throughput ¡Compu(ng ¡

Source: ¡NVIDIA ¡

Moore’s Law

OPTIMIZING MEMORY ACCESS IS INCREASINGLY IMPORTANT!

slide-3
SLIDE 3

Visualiza(on ¡of ¡SoFware ¡Memory ¡Behavior ¡

  • Challenging ¡to ¡

analyze ¡

  • Huge ¡quan(ty ¡of ¡

transac(ons ¡

  • Complex ¡

interconnected ¡ behavior ¡

slide-4
SLIDE 4

Available ¡Data ¡

  • Hardware ¡Performance ¡Counters ¡
  • Cache ¡hits/misses, ¡TLB ¡hits/misses, ¡etc. ¡
  • Instruc(on ¡sampling ¡
  • Low ¡resolu(on, ¡manageable ¡quan(ty ¡of ¡data ¡ ¡
  • Memory ¡Reference ¡Trace ¡
  • Richer, ¡more ¡versa(le ¡data ¡source ¡
  • Incomplete ¡informa(on ¡requiring ¡addi(onal ¡analysis ¡(e.g. ¡

hardware ¡simula(on) ¡

slide-5
SLIDE 5

Memory ¡Reference ¡Trace ¡

. . . W 0x7fffac539ed8 W 0x7fffac539ed0 W 0x7fffac539ecc W 0x7fffac539ec8 R 0x7fffac539ecc R 0x7fffac539ec8 W 0x7fffac539eb8 W 0x7fffac539eb0 . . . ¡

slide-6
SLIDE 6

A.N.M ¡Imroz ¡Choudhury ¡and ¡Paul ¡Rosen. ¡Abstract ¡visualiza(on ¡of ¡run(me ¡memory ¡behavior. ¡In ¡6th ¡IEEE ¡Interna+onal ¡Workshop ¡on ¡Visualizing ¡So8ware ¡for ¡Understanding ¡ and ¡Analysis, ¡VisSoF, ¡pages ¡22-­‑29, ¡2011. ¡

Abstract ¡Visualiza(on ¡of ¡Run(me ¡Memory ¡Behavior ¡

  • Challenge: ¡see ¡the ¡mo(on ¡of ¡

data ¡between ¡cache ¡levels ¡

  • Layout ¡data ¡in ¡concentric ¡

rings ¡represen(ng ¡levels ¡of ¡ memory ¡hierarchy ¡

  • Use ¡our ¡ability ¡to ¡iden(fy ¡

good/bad ¡memory ¡access ¡ paXerns ¡

slide-7
SLIDE 7

A.N.M ¡Imroz ¡Choudhury ¡and ¡Paul ¡Rosen. ¡Abstract ¡visualiza(on ¡of ¡run(me ¡memory ¡behavior. ¡In ¡6th ¡IEEE ¡Interna+onal ¡Workshop ¡on ¡Visualizing ¡So8ware ¡for ¡Understanding ¡ and ¡Analysis, ¡VisSoF, ¡pages ¡22-­‑29, ¡2011. ¡

Naïve Matrix Multiply Blocked Matrix Multiply

Abstract ¡Visualiza(on ¡of ¡Run(me ¡Memory ¡Behavior ¡

slide-8
SLIDE 8

A.N.M. ¡Imroz ¡Choudhury, ¡Bei ¡Wang, ¡Paul ¡Rosen, ¡and ¡Valerio ¡Pascucci. ¡Topological ¡analysis ¡and ¡visualiza(on ¡of ¡cyclical ¡behavior ¡in ¡memory ¡reference ¡traces. ¡In ¡IEEE ¡Pacific ¡ Visualiza+on ¡Symposium, ¡PacificVis, ¡pages ¡9 ¡-­‑16, ¡2012. ¡

TOPOLOGICAL ANALYSIS AND VISUALIZATION OF CYCLICAL MEMORY BEHAVIOR

  • Challenge: ¡iden(fy ¡repe((ve ¡

memory ¡ac(vity ¡

  • Use ¡topological ¡analysis ¡to ¡

iden(fy ¡similar ¡features ¡that ¡ repeat ¡

  • Works ¡at ¡many ¡scales ¡without ¡

any ¡parameter ¡tuning ¡

slide-9
SLIDE 9

Bubble ¡Sort ¡

slide-10
SLIDE 10

Bubble ¡Sort ¡

slide-11
SLIDE 11

A Visual Approach to Investigating Memory Behavior in CUDA

  • Challenge: ¡many ¡threads ¡

with ¡interconnected ¡ behavior ¡

  • Use ¡a ¡drill-­‑down ¡

approach ¡to ¡inves(gate ¡ performance ¡across ¡ 100k’s ¡of ¡threads ¡

  • See ¡memory ¡paXerns ¡

that ¡result ¡in ¡bad ¡ performance ¡

Paul ¡Rosen. ¡A ¡visual ¡approach ¡to ¡inves(ga(ng ¡shared ¡and ¡global ¡memory ¡behavior ¡of ¡cuda ¡kernels. ¡In ¡Computer ¡Graphics ¡Forum ¡(EuroVis), ¡2013. ¡

slide-12
SLIDE 12

Matrix ¡Transpose ¡

slide-13
SLIDE 13

Challenges ¡

  • Performance ¡Counters ¡
  • Most ¡accurate ¡informa(on ¡about ¡performance ¡
  • Detail ¡is ¡limited ¡
  • Memory ¡Reference ¡Traces ¡
  • Lack ¡of ¡hardware ¡valida(on ¡
  • Poten(ally ¡rich ¡source ¡of ¡informa(on ¡
  • Size ¡of ¡data ¡difficult ¡to ¡visualize ¡
slide-14
SLIDE 14

THANK ¡YOU ¡