RiskRoute: A Framework for Mi3ga3ng Network Outage Threats - - PowerPoint PPT Presentation

riskroute a framework for mi3ga3ng
SMART_READER_LITE
LIVE PREVIEW

RiskRoute: A Framework for Mi3ga3ng Network Outage Threats - - PowerPoint PPT Presentation

RiskRoute: A Framework for Mi3ga3ng Network Outage Threats Ramakrishnan Durairajan + Brian Eriksson * , Paul Barford + * Technicolor Palo Alto + University


slide-1
SLIDE 1

RiskRoute: ¡A ¡Framework ¡for ¡Mi3ga3ng ¡ Network ¡Outage ¡Threats ¡

¡

¡

Ramakrishnan ¡Durairajan+ ¡ ¡ ¡ Brian ¡Eriksson*, ¡Paul ¡Barford+ ¡

¡

¡

*Technicolor ¡Palo ¡Alto ¡ +University ¡of ¡Wisconsin ¡

slide-2
SLIDE 2

Problem ¡Setup ¡

Consider ¡Internet ¡physical ¡infrastructure: ¡

Physical ¡Router ¡or ¡PoP ¡

Standard ¡ Rou3ng ¡ Poten3al ¡Backup ¡Routes ¡

Can ¡we ¡choose ¡the ¡best ¡backup ¡route? ¡

2 ¡ Goals ¡: ¡

Can ¡we ¡automa3cally ¡adjust ¡Internet ¡rou3ng ¡to ¡ avoid ¡network ¡outages ¡before ¡they ¡happen? ¡

1 ¡

Fiber ¡op3cs ¡link ¡

Outage ¡

slide-3
SLIDE 3

Network ¡Outage ¡Causes ¡

Censorship ¡

hRp://www.caida.org ¡

Outage ¡ Why? ¡

slide-4
SLIDE 4

Network ¡Outage ¡Causes ¡

Accidents ¡

hRp://www.ap.org/ ¡

Outage ¡ Why? ¡

slide-5
SLIDE 5

Network ¡Outage ¡Causes ¡

Outage ¡

Our ¡Focus: ¡Natural ¡Disaster ¡Events ¡

Thunderstorms ¡ Tornados ¡ ¡ Hurricanes ¡

hRp://www.noaa.gov/ ¡

Why? ¡

slide-6
SLIDE 6

Is ¡the ¡Internet ¡fragile ¡to ¡Natural ¡Disasters? ¡

Network ¡outages ¡increase ¡by ¡4x ¡in ¡storms. ¡

Network ¡ Traffic ¡ Cho ¡et. ¡al., ¡“The ¡ Japan ¡Earthquake…”, ¡ SWID ¡11 ¡ March ¡11th ¡2011 ¡Earthquake ¡

Large-­‑Scale ¡ Disaster ¡Events ¡

End ¡Host ¡ Up-­‑Down ¡ Rate ¡ Schulman ¡and ¡ Spring, ¡“Pingin ¡in ¡ the ¡Rain”, ¡IMC ¡11 ¡

Small-­‑Scale ¡ Disaster ¡Events ¡

Time ¡

slide-7
SLIDE 7

Our ¡Focus ¡: ¡Natural ¡Disasters-­‑Based ¡Outages ¡

In ¡contrast ¡to ¡accidents ¡and ¡censorship, ¡weather-­‑related ¡ events ¡follow ¡predictable ¡geographic ¡and ¡temporal ¡pa3erns. ¡ ¡ ¡

“Tornado ¡Alley” ¡ Earthquake ¡Fault ¡Lines ¡ Hurricane ¡PaRerns ¡

hRp://www.noaa.gov/ ¡

Known ¡Occurrence ¡PaRerns ¡ Predictable ¡Trajectories ¡ via ¡Forecas3ng ¡

slide-8
SLIDE 8

Current ¡Rou3ng ¡Under ¡Disasters ¡

Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡

hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

Answer: ¡Sort ¡of… ¡

slide-9
SLIDE 9

Current ¡Rou3ng ¡Under ¡Disasters ¡

hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡

Level3 ¡Network ¡Topology ¡

To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡

slide-10
SLIDE 10

Current ¡Rou3ng ¡Under ¡Disasters ¡

hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡

Hurricane-­‑ Force ¡Winds ¡ Tropical ¡ Storm-­‑Force ¡ Winds ¡

11:00 ¡PM ¡October ¡28th, 2012 ¡ To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡

Manual ¡Rou3ng ¡Change ¡

Weather ¡ Forecast ¡ Informa3on: ¡

slide-11
SLIDE 11

Current ¡Rou3ng ¡Under ¡Disasters ¡

hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡ Main ¡Problem ¡: ¡Manual ¡rou3ng ¡changes ¡are ¡too ¡3me-­‑ consuming ¡and ¡coarse-­‑scale ¡to ¡be ¡effec3ve. ¡

11:00 ¡PM ¡October ¡29th, 2012 ¡ To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡

slide-12
SLIDE 12

Talk ¡Outline ¡

  • Bit-­‑Risk ¡Miles ¡Metric ¡

– Assess ¡sensi3vity ¡to ¡network ¡outages ¡

  • RiskRoute ¡Framework ¡

– Real-­‑3me ¡rou3ng ¡changes ¡to ¡minimize ¡outage ¡risk ¡

  • Experiments ¡

– Example ¡rou3ng ¡changes ¡on ¡real ¡world ¡networks ¡and ¡ historical ¡disaster ¡case ¡studies ¡ – Robustness ¡sugges3ons ¡ ¡

Goal ¡: ¡Can ¡we ¡exploit ¡the ¡predictability ¡of ¡natural ¡ disasters ¡to ¡automa3cally ¡adjust ¡Internet ¡rou3ng? ¡

slide-13
SLIDE 13

Bit-­‑Risk ¡Miles ¡Metric ¡

  • The ¡idea ¡of ¡bit-­‑miles ¡mo3vates ¡the ¡introduc3on ¡of ¡bit-­‑risk ¡
  • miles. ¡

– Consider ¡a ¡rou3ng ¡path ¡: ¡ – The ¡bit-­‑risk ¡miles ¡of ¡the ¡rou3ng ¡path ¡is ¡defined ¡as: ¡ ¡

¡

Bit ¡Miles ¡ Infrastructure ¡Outage ¡Risk ¡

# ¡of ¡Bits ¡ Sent ¡ Distance ¡ Bit-­‑Risk ¡ Miles ¡ Outage ¡ Risk ¡ i ¡ j ¡

Bit ¡Miles ¡

slide-14
SLIDE 14

Bit-­‑Risk ¡Miles ¡Metric ¡

  • Quan3fies ¡the ¡trade-­‑offs ¡of: ¡

High ¡Risk ¡ Area ¡ Short ¡geographic ¡ rou3ng ¡paths ¡with ¡high ¡

  • utage ¡risk ¡

Long ¡geographic ¡rou3ng ¡ paths ¡with ¡low ¡outage ¡ risk ¡

  • vs. ¡

Bit ¡Miles ¡ Infrastructure ¡Outage ¡Risk ¡

slide-15
SLIDE 15
  • What ¡is ¡the ¡cost ¡of ¡an ¡outage ¡between ¡the ¡source ¡and ¡

des3na3on? ¡

  • In ¡real-­‑world ¡networks, ¡this ¡can ¡be ¡monetary: ¡

– SLA ¡viola3ons ¡ – End ¡user ¡refunds ¡ ¡

  • To ¡approximate ¡this, ¡we ¡use ¡the ¡frac3on ¡of ¡popula3on ¡affected: ¡

United ¡States ¡Popula3on ¡Density ¡(www.census.gov) ¡ Teliasonera ¡Network ¡ A ¡nearest-­‑neighbor ¡par33oning ¡ aggregates ¡popula3on ¡to ¡PoP ¡loca3ons. ¡

slide-16
SLIDE 16
  • What ¡is ¡historical ¡outage ¡probability ¡at ¡this ¡PoP ¡loca3on? ¡

www.noaa.gov, ¡www.fema.gov ¡ ¡ 2,267 ¡Earthquake ¡Occurrences ¡ ¡ 2,805 ¡Hurricane ¡Occurrences ¡ ¡ 20,623 ¡Thunderstorm ¡Occurrences ¡ ¡

Corpus ¡of ¡weather ¡events ¡from ¡1970 ¡to ¡ 2010 ¡

  • 29,865 ¡FEMA ¡emergency ¡

¡declara3ons ¡

  • Over ¡145,000 ¡NOAA ¡severe ¡weather ¡

¡events ¡

slide-17
SLIDE 17

HURRICANE ¡IRENE ¡INTERMEDIATE ¡ADVISORY ¡NUMBER ¡ ¡28A ¡ NWS ¡NATIONAL ¡HURRICANE ¡CENTER ¡MIAMI ¡FL ¡ ¡ ¡ ¡AL092011 ¡ 800 ¡AM ¡EDT ¡SAT ¡AUG ¡27 ¡2011 ¡

  • What ¡is ¡forecasted ¡outage ¡probability ¡at ¡this ¡PoP ¡loca3on? ¡

Hurricane ¡Irene ¡ Hurricane ¡Katrina ¡ Hurricane ¡Sandy ¡

  • Event ¡Center ¡
  • Storm-­‑specific ¡Details ¡
  • Radius ¡of ¡tropical-­‑force ¡

winds ¡

  • Radius ¡of ¡hurricane-­‑force ¡

winds ¡ Na3onal ¡Weather ¡Service, ¡Na3onal ¡ Hurricane ¡Center ¡(www.nhc.noaa.gov) ¡

slide-18
SLIDE 18

RiskRoute ¡Methodology ¡

  • Storing ¡all ¡the ¡backup ¡paths ¡is ¡combinatorial. ¡
  • Current ¡Techniques: ¡Storing ¡only ¡one ¡backup ¡path ¡

(e.g., ¡Fast ¡Reroute) ¡is ¡fragile ¡to ¡large-­‑scale ¡outages. ¡

  • RiskRoute ¡Framework: ¡ ¡Using ¡shortest ¡path ¡

techniques, ¡con3nuously ¡recalculate ¡all ¡paths ¡with ¡ the ¡smallest ¡bit-­‑risk ¡miles: ¡ How ¡do ¡we ¡choose ¡which ¡backup ¡path ¡has ¡the ¡ smallest ¡bit-­‑risk ¡miles? ¡ i ¡ j ¡

Bit-­‑Risk ¡Miles ¡ for ¡route ¡p ¡

slide-19
SLIDE 19

Experiment ¡Datasets ¡

  • Real-­‑World ¡Network ¡

– 7 ¡Tier-­‑1 ¡ISPs, ¡16 ¡regional ¡networks ¡

  • Intra-­‑domain ¡Rou3ng ¡

– Rou3ng ¡inside ¡a ¡specified ¡network ¡

  • Interdomain ¡Rou3ng ¡

– Rou3ng ¡between ¡networks ¡

  • Performance ¡Metrics: ¡

¡

1 ¡

Risk ¡RaCo ¡– ¡The ¡average ¡reduc3on ¡in ¡bit-­‑ risk ¡miles ¡using ¡RiskRoute ¡compared ¡with ¡ shortest ¡path ¡rou3ng ¡

2 ¡

Distance ¡RaCo ¡– ¡The ¡average ¡increase ¡in ¡ bit-­‑miles ¡using ¡RiskRoute ¡compared ¡with ¡ shortest ¡path ¡rou3ng ¡

slide-20
SLIDE 20

Intradomain ¡RiskRoute ¡Results ¡

Historical ¡Outage ¡Probability ¡

Historical ¡Outage-­‑Only ¡Bit-­‑Risk ¡Miles ¡ metric: ¡

Tuning ¡ parameter ¡

Shortest ¡ Path ¡ RiskRoute ¡ Path ¡

slide-21
SLIDE 21

Intradomain ¡RiskRoute ¡Results ¡

  • What ¡are ¡the ¡tradeoffs ¡to ¡using ¡RiskRoute? ¡

Average ¡frac3on ¡ reduc3on ¡in ¡bit-­‑ risk ¡miles. ¡ Average ¡frac3on ¡ increase ¡in ¡bit-­‑

  • miles. ¡
slide-22
SLIDE 22

Intradomain ¡RiskRoute ¡Results ¡

  • What ¡makes ¡some ¡networks ¡more ¡advantageous ¡towards ¡

using ¡RiskRoute? ¡

Reduc3on ¡in ¡ Bit-­‑Risk ¡Miles ¡ (Risk ¡Ra3o) ¡

Geographic ¡Footprint ¡

  • Aver. ¡Router ¡Outdegree ¡

Increase ¡in ¡Bit-­‑ Miles ¡ (Distance ¡Ra3o) ¡

Number ¡of ¡PoPs ¡ Number ¡of ¡Peers ¡

slide-23
SLIDE 23

RiskRoute ¡Robustness ¡Analysis ¡

We ¡find ¡the ¡best ¡addi3onal ¡link ¡such ¡ that ¡the ¡bit-­‑risk ¡miles ¡is ¡minimized. ¡

Sprint ¡Network ¡ Level3 ¡Network ¡

Intradomain ¡ Results: ¡ Interdomain ¡ Results: ¡

slide-24
SLIDE 24

RiskRoute ¡Robustness ¡Analysis ¡

1 2 3 4 5 6 7 8 0.8 0.85 0.9 0.95 1 Number of Additional Links Added Fraction of original Bit−Risk Miles Level3 ATT Deutsche NTT Sprint Tinet Teliasonera

  • Can ¡all ¡networks ¡decrease ¡risk ¡via ¡the ¡new ¡link ¡

infrastructure? ¡

slide-25
SLIDE 25

Hurricane ¡Irene ¡and ¡the ¡Level3 ¡Network ¡

slide-26
SLIDE 26

Hurricane ¡Katrina ¡and ¡the ¡Level3 ¡Network ¡

slide-27
SLIDE 27

Tier-­‑1 ¡network ¡case ¡study ¡

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Risk Ratio

2 AM FRI OCT 26 2012 5 PM FRI OCT 26 2012 8 AM SAT OCT 27 2012 11 PM SAT OCT 27 2012 2 PM SUN OCT 28 2012 5 AM MON OCT 29 2012 11 PM MON OCT 29 2012

Level3 ATT Deutsche NTT Sprint Tinet Teliasonera

¡Hurricane ¡Irene ¡(Leq) ¡ ¡ ¡ ¡Hurricane ¡Sandy ¡(Right) ¡

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Risk Ratio

2 AM FRI AUG 26 2011 5 PM FRI AUG 26 2011 5 AM SAT AUG 27 2011 7 PM SAT AUG 27 2011 8 AM SUN AUG 28 2011 11 PM SUN AUG 28 2011

Level3 ATT Deutsche NTT Sprint Tinet Teliasonera

slide-28
SLIDE 28

Purng ¡RiskRoute ¡into ¡Prac3ce ¡

  • Intra-­‑domain ¡rou3ng ¡

– OSPF ¡or ¡ISIS ¡ – link ¡weights ¡are ¡composite ¡of ¡opera3onal ¡objec3ves ¡and ¡ RiskRoute ¡

  • Inter-­‑domain ¡rou3ng ¡

– Conjunc3on ¡with ¡proposed ¡BGP ¡“add ¡paths” ¡op3on ¡ – Can ¡lead ¡to ¡new ¡provider ¡or ¡peering ¡rela3onships ¡

slide-29
SLIDE 29

Conclusions ¡

  • We ¡presented ¡RiskRoute, ¡a ¡real-­‑3me ¡rou3ng ¡

framework ¡for ¡mi3ga3ng ¡outage ¡threats. ¡

  • We ¡use ¡a ¡large ¡corpus ¡of ¡network ¡physical ¡

infrastructures, ¡popula3on ¡data, ¡historical ¡disaster ¡ events, ¡and ¡weather ¡forecast ¡informa3on. ¡

  • Our ¡disaster ¡case ¡studies ¡demonstrate ¡how ¡

RiskRoute ¡can ¡incorporate ¡weather ¡forecast ¡ informa3on ¡to ¡avoid ¡outage ¡risks. ¡

slide-30
SLIDE 30

¡ ¡ Ques3ons? ¡ ¡

¡