ne lix case study
play

Ne*lix Case Study 2 - PowerPoint PPT Presentation

Cloud Computing ECPE 276 Ne*lix Case Study 2 h6ps://media.ne*lix.com/en/company-blog/compleBng-the-ne*lix-cloud-migraBon Cloud Compu2ng Spring


  1. ì ¡ Cloud ¡Computing ¡ ECPE ¡276 ¡ Ne*lix ¡ ¡ Case ¡Study ¡

  2. 2 ¡ h6ps://media.ne*lix.com/en/company-­‑blog/compleBng-­‑the-­‑ne*lix-­‑cloud-­‑migraBon ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  3. 3 ¡ Netflix ¡& ¡The ¡Cloud ¡ ì Cloud ¡provider: ¡AWS ¡ ì Services ¡at ¡AWS ¡ Business ¡logic, ¡billing, ¡payments ¡ ì Distributed ¡databases ¡ ì Big ¡data ¡processing/analyBcs ¡ ì RecommendaBons ¡ ì Transcoding ¡ ì ì Video ¡streaming ¡ not ¡at ¡AWS ¡ Ne*lix ¡ Open ¡Connect ¡CDN ¡ ì (Ne*lix-­‑owned ¡servers ¡co-­‑located ¡at/near ¡customer ¡ISPs) ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  4. 4 ¡ Netflix ¡Scale ¡ ì 2015 ¡ Sandvine ¡report ¡ ì Streaming ¡video ¡and ¡audio ¡traffic ¡now ¡accounts ¡for ¡ over ¡70% ¡of ¡North ¡American ¡downstream ¡traffic ¡ ì Peak ¡evening ¡hours, ¡fixed ¡access ¡networks ¡(not ¡ wireless) ¡ ì Top ¡3 ¡sources ¡of ¡video ¡traffic? ¡ ì Ne9lix ¡-­‑ ¡37.1% ¡ Math: ¡ 70% ¡* ¡37.1% ¡= ¡ ì YouTube ¡-­‑ ¡17.9% ¡ 25.9% ¡of ¡evening ¡ ì Amazon ¡Video ¡-­‑ ¡3.1% ¡ traffic ¡is ¡ Ne0lix ¡ h6ps://www.sandvine.com/pr/2015/12/7/sandvine-­‑over-­‑70-­‑of-­‑north-­‑american-­‑traffic-­‑is-­‑now-­‑streaming-­‑video-­‑and-­‑audio.html ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  5. 5 ¡ Cloud ¡Migration ¡Timeline ¡ ì 7 ¡years ¡migra2on ¡ from ¡private ¡datacenter ¡to ¡cloud ¡ ì MigraBon ¡strategy ¡ op2on ¡“A” : ¡ ¡ Configure ¡AWS ¡to ¡match ¡your ¡current ¡datacenter ¡ ì Equivalent ¡EC2 ¡nodes ¡ ì Equivalent ¡network ¡topology ¡ ¡ (“Virtual ¡Private ¡Cloud”) ¡ ì Run ¡the ¡same ¡applicaBons ¡you ¡already ¡do ¡ ì Pros? ¡Cons? ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  6. 6 ¡ Cloud ¡Migration ¡Timeline ¡ ì 7 ¡years ¡migra2on ¡ from ¡private ¡datacenter ¡to ¡cloud ¡ ì MigraBon ¡strategy ¡ op2on ¡“B” : ¡ Rebuild ¡your ¡applica2ons ¡ and ¡corporate ¡processes ¡ to ¡follow ¡cloud ¡norms ¡ ì Monolithic ¡app ¡-­‑> ¡Micro ¡applicaBons ¡(e.g. ¡ Lambda ) ¡ ì RelaBonal ¡DB ¡-­‑> ¡NoSQL ¡database ¡(e.g. ¡ DynamoDB ) ¡ ì Budget ¡approvals ¡/ ¡procurement ¡-­‑> ¡Self-­‑service ¡tools ¡ for ¡new ¡cloud ¡nodes ¡ ì Pros? ¡Cons? ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  7. 7 ¡ Cloud ¡Migration ¡Timeline ¡ ì Ne*lix ¡chose ¡opBon ¡“B” ¡(hence, ¡the ¡7 ¡years ¡to ¡ migrate) ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  8. AWS ¡re:Invent ¡2015 ¡| ¡(DVO203) ¡ ¡ 8 ¡ ¡ A ¡Day ¡in ¡the ¡Life ¡of ¡a ¡Ne*lix ¡Engineer ¡using ¡37% ¡of ¡the ¡Internet ¡ h6ps://www.youtube.com/watch?v=-­‑mL3zT1iIKw ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  9. 9 ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  10. 10 ¡ ì Chaos ¡Monkey ¡ ì Chaos ¡Gorilla ¡ ì Chaos ¡Kong ¡ ì Armageddon ¡Monkey ¡ (disable ¡AMAZON!) ¡ ì Janitor ¡Monkey ¡ ì Conformity ¡Monkey ¡ h6p://techblog.ne*lix.com/ 2011/07/ne*lix-­‑simian-­‑army.html ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  11. 11 ¡ Chaos ¡Monkey ¡ IdenBfy ¡group ¡of ¡systems, ¡and ¡ ì randomly ¡terminate ¡one ¡server ¡ Runs ¡during ¡off-­‑peak, ¡normal ¡ ì business ¡hours ¡while ¡engineers ¡are ¡ working ¡ Idea: ¡Unleash ¡a ¡wild ¡monkey ¡with ¡a ¡ ì weapon ¡in ¡your ¡data ¡center ¡to ¡ randomly ¡shoot ¡down ¡instances ¡and ¡ chew ¡through ¡cables ¡-­‑-­‑ ¡all ¡the ¡while ¡ conBnuing ¡to ¡serve ¡customers ¡ without ¡interrupBon ¡ ¡ Why ¡would ¡you ¡do ¡this? ¡ ì Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  12. 12 ¡ Chaos ¡Monkey ¡Motivation ¡ “Failures ¡happen, ¡and ¡they ¡inevitably ¡happen ¡when ¡least ¡desired.” ¡ “If ¡your ¡applicaBon ¡can't ¡tolerate ¡a ¡system ¡failure ¡would ¡you ¡ rather ¡find ¡out ¡by ¡being ¡paged ¡at ¡3am ¡or ¡aqer ¡you ¡are ¡in ¡the ¡ office ¡having ¡already ¡had ¡your ¡morning ¡coffee?” ¡ “Even ¡if ¡you ¡are ¡confident ¡that ¡your ¡architecture ¡can ¡ tolerate ¡a ¡system ¡failure, ¡are ¡you ¡sure ¡it ¡will ¡sBll ¡be ¡able ¡to ¡ next ¡week ¡or ¡next ¡month? ¡ ¡Soqware ¡is ¡complex ¡and ¡ dynamic, ¡that ¡"simple ¡fix" ¡you ¡put ¡in ¡place ¡last ¡week ¡could ¡ have ¡undesired ¡consequences.” ¡ h6ps://github.com/Ne*lix/SimianArmy/wiki/Chaos-­‑Monkey ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  13. 13 ¡ Chaos ¡Monkey ¡Motivation ¡ ì With ¡ Chaos ¡Monkey , ¡the ¡ engineers ¡ know ¡which ¡ servers/services ¡were ¡killed ¡(via ¡logging), ¡so ¡they ¡ can ¡diagnose ¡& ¡correct ¡any ¡unanBcipated ¡failures ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  14. 14 ¡ Chaos ¡Gorilla ¡ ¡ ì Simulates ¡outage ¡of ¡ enBre ¡ AWS ¡ availability ¡zone ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  15. 15 ¡ Chaos ¡Kong ¡ ì Simulates ¡outage ¡of ¡enBre ¡ AWS ¡region ¡ ì Real ¡life ¡failure: ¡ ì DynamoDB ¡(and ¡dependent ¡ services) ¡failed ¡in ¡US-­‑ EAST-­‑1 ¡region ¡on ¡Sept ¡20 th ¡ 2015 ¡for ¡6-­‑8 ¡hours ¡ ì Simula2ng ¡this ¡in ¡advance ¡ allowed ¡Ne*lix ¡to ¡ survive ¡ failure ¡ h6p://techblog.ne*lix.com/2015/09/ chaos-­‑engineering-­‑upgraded.html ¡ ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  16. 16 ¡ Latency ¡Monkey ¡ Introduce ¡ ar>ficial ¡delays ¡ in ¡RESTful ¡client-­‑ ì server ¡communicaBon ¡layer ¡ Small ¡delays ¡simulate ¡service ¡ degrada>on ¡ ¡ ì Measure ¡if ¡upstream ¡services ¡respond ¡ ì appropriately ¡ Large ¡delays ¡ simulate ¡failure ¡of ¡node ¡or ¡ ì service ¡(without ¡physically ¡bringing ¡instances ¡ down) ¡ Test ¡fault-­‑tolerance ¡of ¡a ¡service ¡by ¡ ì simulaBng ¡the ¡failure ¡of ¡its ¡dependencies, ¡ without ¡making ¡these ¡dependencies ¡ unavailable ¡to ¡the ¡rest ¡of ¡the ¡system ¡ Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

  17. 17 ¡ Open ¡Source ¡Monkeys ¡ ì h6ps://github.com/Ne*lix/SimianArmy/ wiki ¡ ì Chaos ¡Monkey ¡ ì Janitor ¡Monkey ¡ Locate ¡unused ¡resources ¡and ¡terminate ¡ ì them ¡ ì Conformity ¡Monkey ¡ Locate ¡nodes ¡not ¡following ¡best ¡prac>ces ¡ ì and ¡terminate ¡them ¡ Example: ¡Nodes ¡not ¡in ¡auto-­‑scaling ¡group ¡ ì Cloud ¡Compu2ng ¡ Spring ¡2016 ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend