Prashant Pandey1 Michael A. Bender1 Rob Johnson1,2
1Stony Brook University, NY 2VMware Research
Scheduling Problems in Write-Optimized Key-Value Stores Prashant - - PowerPoint PPT Presentation
Scheduling Problems in Write-Optimized Key-Value Stores Prashant Pandey 1 Michael A. Bender 1 Rob Johnson 1,2 1 Stony Brook University, NY 2 VMware Research Key-Value Stores are Ubiquitous K1 Rob K2 Michael K3 Don K4 Bill K5 Jun K6
1Stony Brook University, NY 2VMware Research
2
K1 K2 K3 K4 K5 K6 Rob Michael Don Bill Jun Yang
3
4
5
6
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
7
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
8
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
9
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
10
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
11
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
12
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
13
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
14
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
15
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
#Messages going to one child must be at least (B- Bε) / Bε ≈ B1-ε
16
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
17
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
18
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
19
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
#Messages going to one child must be at least (B- Bε) / Bε ≈ B1-ε
20
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. ….. Result
21
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. …..
O (logBε N)
... ≈ Bε children ... ... ≈ N / B leaves ...
○ Data is transferred in blocks between RAM and disk. ○ The number of block transfers dominates the running time.
○ Performance bounds are parameterized by block size B, memory size M, data size N.
Disk RAM B B M
22
23
24
25
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
26
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
27
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
28
29
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
30
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
31
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
32
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
33
B - Bε Bε Message buffer Pivots B - Bε Bε B - Bε Bε B - Bε Bε ….. ….. …..
34
35
36
37
38
Write-optimized key-value stores, such as Bε-trees, are the state-of-the-art key-value
data. During batch data moves in practice, we see an inherent tension between operation latency and I/O bandwidth utilization in Bε-trees trees. This talk presents an open problem
41