Flash ¡Reliability ¡in ¡Produc4on: ¡
¡
Flash Reliability in Produc4on: The Importance of - - PowerPoint PPT Presentation
Flash Reliability in Produc4on: The Importance of Measurement and Analysis in Improving System Reliability Bianca Schroeder (Currently on sabbatical at Microsoft Research Redmond)
¡
4
▪
▪
5
6
7
Consistent with [Narayanan’17]
§ Only ¡1-‑2% ¡of ¡drives ¡replaced ¡annually ¡-‑-‑ ¡ ¡much ¡lower ¡than ¡hard ¡disks! ¡ § Drives ¡benefiAed ¡from ¡ability ¡to ¡tolerate ¡chip ¡failure ¡
§ 0.5-‑1.5% ¡of ¡drives ¡developed ¡bad ¡chips ¡per ¡year ¡
8
§ 26-‑60% ¡of ¡drives ¡see ¡uncorrectable ¡errors ¡in ¡their ¡life ¡(Google) ¡
§ 2-‑6 ¡out ¡of ¡1,000 ¡drive ¡days ¡experience ¡uncorrectable ¡errors ¡
§ 0.2-‑75% ¡of ¡drives ¡at ¡Facebook ¡[Meza ¡et ¡al. ¡2015] ¡ § Rates ¡at ¡MicrosoT ¡10X ¡higher ¡than ¡target ¡rate ¡[Narayanan ¡et ¡al. ¡2016] ¡
§ Much ¡worse ¡than ¡for ¡hard ¡
§ These ¡errors ¡are ¡insideous ¡as ¡
9
10
11
12
13
14
15
16
17
18
19
20
[Mielke2008]
21
22
23
24
¡
SMART1 SMART2 SMART254
25
¡
¡
¡
Catch 90% of errors at 2% false alarm rate. Seagate HDS722020ALA330
¡
¡
Seagate error predictions using Hitachi-trained model
30
¡ ¡
31
¡
32
33
¡
Nearly 2X improvement for 2% time spent accelerated. Nearly 1.5X improvement for 1% time spent accelerated.
34
¡
35
¡
36
¡
37
38