SLIDE 4 Execution ¡Model
Introduction ¡ ¡ GPUs GPU-‐‒(D)BE ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Results ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Conclusions
- F. ¡Fioretto, ¡T. ¡Le, ¡E. ¡Pontelli, ¡W. ¡Yeoh, ¡T. ¡Son
4
Block ¡ (0,0) Block ¡ (1,0) Block ¡ (2,0) Block ¡ (0,1) Block ¡ (1,1) Block ¡ (2,1) Kernel ¡1 Kernel ¡2
B
Thread (0,0) Thread (1,0) Thread (2,0) Thread (3,0) Thread (4,0) Thread (0,1) Thread (1,1) Thread (2,1) Thread (3,1) Thread (4,1) Thread (0,2) Thread (1,2) Thread (2,2) Thread (3,2) Thread (4,2) Thread (0,3) Thread (1,3) Thread (2,3) Thread (3,3) Thread (4,3)
warp
Host Device
Block ¡ (0,0) Block ¡ (1,0) Block ¡ (2,0) Block ¡ (0,1) Block ¡ (1,1) Block ¡ (2,1) warp warp warp warp warp warp
...
- A ¡Thread ¡is ¡the ¡basic ¡parallel ¡unit.
- Threads are ¡organized ¡into ¡a Block.
- Several ¡warps ¡are ¡scheduled ¡for ¡
the ¡execution ¡of ¡a ¡GPU ¡function.
- Several ¡Streaming ¡Multiprocessors, ¡
(SD) ¡scheduled ¡in ¡parallel.
- Single ¡Instruction ¡Multiple ¡Thread
(SIMT) ¡parallel ¡model.