SLIDE 3 T ¡ T ¡ T ¡ T ¡ T ¡ T ¡ T ¡ T ¡
C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡ C ¡
SMTs ¡ 12 ¡CORES ¡ PER ¡SOCKET ¡ SMX ¡ Streaming ¡ Mul8processors ¡ SP ¡CUDA ¡cores, ¡ DP ¡units, ¡etc.. ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡ SMX ¡
L1 ¡ L2 ¡ L3 ¡ L4 ¡ L3 ¡ DRAM ¡
Constant ¡ Read-‑Only ¡ L1+SMEM ¡ L2 ¡ DRAM ¡
2 ¡TB+ ¡ 12 ¡GB ¡
Processing ¡ Storage ¡ Kepler/Maxwell ¡ Kepler/Maxwell ¡ Kepler/Maxwell ¡
P8 ¡ P8 ¡
NVLINK/PCI-‑E ¡
3 ¡
Kepler/Maxwell ¡ Latency ¡SensiRve ¡ High ¡single ¡thread ¡performance ¡ Hide ¡latency ¡via ¡memory ¡prefetch ¡or, ¡ Cache ¡hierarchy ¡for ¡spaKal ¡and ¡temporal ¡locality ¡ Throughput ¡OpRmized ¡ OpKmized ¡for ¡mulK-‑threaded ¡code ¡ Low ¡overhead ¡context ¡switch ¡ Hide ¡memory ¡latency ¡with ¡threads ¡
ExploiFng ¡Heterogeneous ¡Node ¡Resources
Kepler ¡