Motivation STM Best performance Faster Expected gains - - PowerPoint PPT Presentation

▶

May 18, 2023 219 likes •347 views

F AST L ANE Streamlining Transactions for Low Thread Counts Jons-Tobias Wamhoff Christof Fetzer Technische Universitt Dresden, Germany Pascal Felber Etienne Rivire Universit de Neuchtel, Switzerland Gilles Muller INRIA, France

SLIDE 1

FASTLANE

Streamlining Transactions for Low Thread Counts

Jons-Tobias Wamhoff Christof Fetzer Technische Universität Dresden, Germany Pascal Felber Etienne Rivière Université de Neuchâtel, Switzerland Gilles Muller INRIA, France

SLIDE 2

Motivation

Number of cores

x Performance

Slower Faster Sequential STM FastLane Best performance Expected gains from FastLane Many

SLIDE 3

General Idea

1 master thread
Commits transactions without aborting
Minimal instrumentation and bookkeeping
N helper threads
Commit transactions only when not in conflict
Contribute progress without impairing on the

performance of the master

SLIDE 4

Code Paths

START SEQUENTIAL uninstrumented MASTER lightweight instrumented writes HELPER instrumented, synchronize with master STM instrumented, extensive bookkeeping COMMIT pessimistic code paths speculative code paths

SLIDE 5

Code Paths

Dresden TM Compiler
Generates multiple code paths for sequential

(uninstrumented), FastLane (master & helper) and STM

Generic START and COMMIT calls with internal branch
READ and WRITE are specific to code path and inlined
transaction descriptor only accessed if needed
TinySTM++ TM runtime
Dynamically select code path based on core or thread

count at BEGIN

5 Christie et al.: Evaluation of AMD's Advanced Synchronization Facility Within a Complete Transactional Memory Stack, EuroSys '10

SLIDE 6

Data Structures

Dirty array Timestamp Timestamp Master thread isMaster Memory ... ... Address read Address written ... Address read Helper thread Start timestamp Write-set ... Read-set Counter

dd: owned

even: otherwise

SLIDE 7

Master vs. Helper

MASTER READ (addr) return *addr BEGIN acquire(cntr) COMMIT release(cntr) WRITE (addr, val) addr = val dirty[hash(addr)] = cntr HELPER BEGIN start = cntr READ (addr) dirty[hash(addr)] ≤ start add(read-set, addr) abort return *addr WRITE (addr, val) dirty[hash(addr)] ≤ start put(write-set, addr, val) abort COMMIT

SLIDE 8

3 Commit Variants

COMMIT 1 acquire(cntr) VALIDATE abort proceed

SLIDE 9

3 Commit Variants

COMMIT 1 acquire(cntr) VALIDATE abort proceed COMMIT 2 c = awaitEven(cntr) VALIDATE cntr ≤ c+1 ∨ VALIDATE acquire(cntr) abort proceed abort

SLIDE 10

3 Commit Variants

COMMIT 1 acquire(cntr) VALIDATE abort proceed COMMIT 2 c = awaitEven(cntr) VALIDATE cntr ≤ c+1 ∨ VALIDATE acquire(cntr) abort proceed abort COMMIT 3 c = awaitEven(cntr) VALIDATE tryAcquire (cntr, c) failed abort proceed

Spear et al.: RingSTM: Scalable Transactions with a Single Atomic Instruction, SPAA '08

SLIDE 11

Intset Benchmarks

SLIDE 12

FASTLANE

Streamlining Transactions for Low Thread Counts

Motivation

General Idea

Code Paths

Code Paths

Data Structures

Master vs. Helper

3 Commit Variants

3 Commit Variants

3 Commit Variants

Intset Benchmarks

Thank you!