Harmony: ¡Collec.on ¡and ¡Analysis ¡
- f ¡Parallel ¡Block ¡Vectors ¡
Melanie ¡Kambadur ¡ Kui ¡Tang, ¡Martha ¡Kim ¡ Columbia ¡University ¡ ¡
1 ¡
Harmony: Collec.on and Analysis of Parallel Block Vectors - - PowerPoint PPT Presentation
Harmony: Collec.on and Analysis of Parallel Block Vectors Melanie Kambadur Kui Tang, Martha Kim Columbia University 1 Parallelism Time 2
1 ¡
2 ¡
3 ¡
4 ¡
5 ¡
6 ¡
7 ¡
8 ¡
9 ¡
TC=1 ¡ TC=1 ¡ TC=4 ¡ TC=3 ¡ BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
10 ¡
TC=1 ¡ TC=1 ¡ TC=4 ¡ TC=3 ¡ BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
11 ¡
TC=1 ¡ TC=1 ¡ TC=4 ¡ TC=3 ¡ BB6 ¡ BB7 ¡ BB9 ¡ BB6 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB9 ¡
BB8 ¡ BB1 ¡ BB5 ¡
12 ¡
13 ¡
14 ¡
15 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
16 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
17 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
18 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
19 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
20 ¡
21 ¡
0 % 10 % 20 % 30 % 40 % 50 % blackscholes bodytrack dedup facesim fluidanimate streamcluster swaptions x264 blackscholes bodytrack dedup facesim fluidanimate streamcluster swaptions x264 Overhead Keep Thread Count Increment Histogram Profiling (Effective Threads) Profiling (Nominal Threads)
22 ¡
BB6 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB6 ¡ BB1 ¡ BB2 ¡ BB7 ¡ BB8 ¡ BB9 ¡ BB7 ¡ BB6 ¡ BB8 ¡ BB3 ¡ BB4 ¡ BB5 ¡ BB9 ¡
23 ¡
5 Nominal TC (3054 BBLs) 1 100 10000 1e+06 1e+08 1e+10 1e+12 5 Nominal TC (3054 BBLs)
Nominal TC (3547 BBLs) Nominal TC (3547 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs)
24 ¡
5 Nominal TC (3054 BBLs) 1 100 10000 1e+06 1e+08 1e+10 1e+12 5 Nominal TC (3054 BBLs)
Nominal TC (3547 BBLs) Nominal TC (3547 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs)
25 ¡
5 Nominal TC (3054 BBLs) 1 100 10000 1e+06 1e+08 1e+10 1e+12 5 Nominal TC (3054 BBLs)
Nominal TC (3547 BBLs) Nominal TC (3547 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs)
26 ¡
5 Nominal TC (3054 BBLs) 1 100 10000 1e+06 1e+08 1e+10 1e+12 5 Nominal TC (3054 BBLs)
Nominal TC (3547 BBLs) Nominal TC (3547 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs)
27 ¡
28 ¡
5 Nominal TC (3054 BBLs) 1 100 10000 1e+06 1e+08 1e+10 1e+12 5 Nominal TC (3054 BBLs)
Nominal TC (3547 BBLs) Nominal TC (3547 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC fluidanimate (374 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC streamcluster (286 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC swaptions (147 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs) 1 2 3 4 5 Nominal TC x264 (3054 BBLs)
29 ¡
30 ¡
31 ¡
ld/st lea arith (int) arith (fp)
0.2 0.4 0.6 0.8 1 All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel x264 streamcluster fluidanimate facesim
cmp cond CT uncond CT sync
arith (int) arith (fp) stack cmp cond CT
32 ¡
ld/st lea arith (int) arith (fp)
0.2 0.4 0.6 0.8 1 All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel x264 streamcluster fluidanimate facesim
cmp cond CT uncond CT sync
arith (int) arith (fp) stack cmp cond CT
33 ¡
ld/st lea arith (int) arith (fp)
0.2 0.4 0.6 0.8 1 All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel x264 streamcluster fluidanimate facesim
cmp cond CT uncond CT sync
arith (int) arith (fp) stack cmp cond CT
34 ¡
ld/st lea arith (int) arith (fp)
0.2 0.4 0.6 0.8 1 All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel All Serial Mixed Parallel x264 streamcluster fluidanimate facesim
cmp cond CT uncond CT sync
arith (int) arith (fp) stack cmp cond CT
35 ¡
36 ¡
blackscholes bodytrack dedup facesim fluidanimate blackscholes bodytrack dedup facesim fluidanimate
facesim fluidanimate streamcluster swaptions x264 facesim fluidanimate streamcluster swaptions x264
37 ¡
38 ¡
39 ¡
5 Nominal TC 5 Nominal TC 1 2 3 4 5 Nominal TC 1 2 3 4 5 Nominal TC 1 Nominal TC 1 Nominal TC
40 ¡
41 ¡
42 ¡