Classifying conges.on in Ark measurements Steven Bauer - - PowerPoint PPT Presentation

classifying conges on in ark measurements
SMART_READER_LITE
LIVE PREVIEW

Classifying conges.on in Ark measurements Steven Bauer - - PowerPoint PPT Presentation

Classifying conges.on in Ark measurements Steven Bauer MIT March 31, 2015 How Ark (and the Ark community) could further my research We should


slide-1
SLIDE 1

Classifying ¡conges.on ¡in ¡Ark ¡ measurements ¡

Steven ¡Bauer ¡ MIT ¡ March ¡31, ¡2015 ¡

slide-2
SLIDE 2

How ¡Ark ¡(and ¡the ¡Ark ¡community) ¡ could ¡further ¡my ¡research ¡

slide-3
SLIDE 3

We ¡should ¡do ¡a ¡beIer ¡job ¡sharing ¡best ¡ common ¡prac.ces ¡and ¡lessons ¡learned ¡ from ¡working ¡with ¡large ¡networking ¡ data ¡sets ¡

I ¡am ¡par.cularly ¡interested ¡in ¡the: ¡ ¡

– Ark ¡data ¡ – FCC ¡/ ¡Samknows ¡data ¡ – Measurement ¡Lab ¡data ¡

slide-4
SLIDE 4
  • 1. ¡Ideas ¡/ ¡Ques.ons ¡
  • 2. ¡Implementa.on ¡
  • 3. ¡Evalua.on ¡

Accelerate ¡this ¡loop ¡

slide-5
SLIDE 5

afd ¡ afd ¡

Storage ¡ Compute ¡ Infrastructure ¡ Lots ¡of ¡possible ¡solu-ons ¡(and ¡problems) ¡

(Just ¡some ¡examples) ¡

slide-6
SLIDE 6

Some ¡observa.ons ¡on ¡how ¡other ¡communi.es ¡ facilitate ¡replica.ng ¡results ¡

  • IPython ¡Notebooks: ¡all ¡the ¡rage ¡in ¡some ¡

communi.es ¡

– Facilitate ¡easy ¡explora.on ¡and ¡ini.al ¡ experimenta.on ¡of ¡code ¡and ¡data ¡ – En.re ¡books ¡with ¡text, ¡code, ¡data, ¡and ¡visual ¡ results ¡bound ¡together ¡ ¡

  • Other ¡scien.fic ¡communi.es ¡have ¡extensive ¡

experience ¡and ¡lessons ¡learned ¡from ¡data ¡ sharing ¡ ¡

slide-7
SLIDE 7

Lots ¡of ¡work ¡has ¡been ¡funded ¡to ¡make ¡ sharing ¡large ¡amounts ¡of ¡complicated ¡ scien.fic ¡data ¡easier ¡

(Just ¡some ¡examples) ¡

CBOR ¡

RFC ¡7049 ¡

slide-8
SLIDE 8

Slide ¡from ¡hIp://www.opendap.org/sites/default/ files/TabularData.pptx ¡

slide-9
SLIDE 9

Slide ¡from ¡hIp://www.opendap.org/sites/default/ files/TabularData.pptx ¡

slide-10
SLIDE 10

Classifying ¡conges.on ¡in ¡Ark ¡ measurements ¡

(See ¡earlier ¡talks ¡by ¡ Among ¡and ¡MaIhew ¡ for ¡background) ¡

slide-11
SLIDE 11

Classifica.on ¡system ¡

¡ ¡ Train ¡ Classifier ¡ ¡ Ark ¡TSP ¡ data ¡ ¡ Ark ¡TSP ¡ data ¡

~130K ¡ ¡

slide-12
SLIDE 12

¡ ¡ Train ¡ Classifier ¡ ¡ Ark ¡TSP ¡ data ¡ ¡ Ark ¡TSP ¡ data ¡

Classifica.on ¡system ¡

Human ¡in ¡the ¡loop ¡

slide-13
SLIDE 13

Objec.ves ¡of ¡human ¡reviewers ¡

  • 1. Review ¡links ¡with ¡“new” ¡or ¡“interes.ng” ¡

conges.on ¡changes ¡

– Conges.on ¡on ¡formerly ¡uncongested ¡link ¡ – No ¡conges.on ¡on ¡formerly ¡congested ¡link ¡ – Change ¡in ¡the ¡nature ¡of ¡conges.on ¡on ¡a ¡link ¡

  • 2. Generate ¡annota.on ¡data ¡that ¡will ¡be ¡useful ¡

in ¡improving ¡conges.on ¡classifier ¡

  • 3. Development ¡of ¡good ¡features ¡
slide-14
SLIDE 14

Simple ¡system ¡architecture ¡

slide-15
SLIDE 15

Detailed ¡system ¡architecture ¡

slide-16
SLIDE 16

Wavelet ¡features ¡

slide-17
SLIDE 17

Research ¡agenda ¡

  • Improve ¡features ¡being ¡extracted ¡
  • Classifica.on ¡algorithms ¡

– Random ¡forest ¡ – K-­‑NN ¡

  • Trigger ¡addi.onal ¡tests: ¡

– Model ¡Based ¡Metrics ¡tests ¡on ¡Ark ¡nodes ¡

slide-18
SLIDE 18

Model ¡Based ¡Metrics ¡(MBM) ¡

slide-19
SLIDE 19

Model ¡Based ¡Metrics ¡

Suppress ¡equilibrium ¡behavior ¡by ¡open ¡looping ¡ TCP ¡

  • ­‑ ¡IP ¡test ¡traffic ¡mimics ¡TCP ¡independent ¡of ¡the ¡

network ¡details ¡

  • ­‑ ¡IP ¡success ¡criteria ¡is ¡based ¡on ¡TCP ¡models ¡
  • ­‑ ¡Eliminate ¡circular ¡interac.ons ¡between ¡RTT, ¡packet ¡

loss ¡and ¡data ¡rate ¡

Slide ¡details ¡from: ¡ ¡ hIp://www.ief.org/proceedings/92/slides/slides-­‑92-­‑ippm-­‑7.pdf ¡ ¡