1 ----- Mee&ng Notes (10/7/14 16:22) - - PDF document

1 mee ng notes 10 7 14 16 22
SMART_READER_LITE
LIVE PREVIEW

1 ----- Mee&ng Notes (10/7/14 16:22) - - PDF document

1 ----- Mee&ng Notes (10/7/14 16:22) ----- Data summary: numbers for all of these 2 3 4 5


slide-1
SLIDE 1

1 ¡

slide-2
SLIDE 2

¡ ¡

  • ­‑-­‑-­‑-­‑-­‑ ¡Mee&ng ¡Notes ¡(10/7/14 ¡16:22) ¡-­‑-­‑-­‑-­‑-­‑ ¡

Data ¡summary: ¡numbers ¡for ¡all ¡of ¡these ¡ 2 ¡

slide-3
SLIDE 3

3 ¡

slide-4
SLIDE 4

4 ¡

slide-5
SLIDE 5

5 ¡

slide-6
SLIDE 6

¡

  • ­‑-­‑-­‑-­‑-­‑ ¡Mee&ng ¡Notes ¡(10/7/14 ¡16:22) ¡-­‑-­‑-­‑-­‑-­‑ ¡

Throw ¡out ¡bad ¡data ¡un&l ¡you ¡get ¡to ¡good ¡data ¡ 6 ¡

slide-7
SLIDE 7

7 ¡

slide-8
SLIDE 8

¡

  • ­‑-­‑-­‑-­‑-­‑ ¡Mee&ng ¡Notes ¡(10/7/14 ¡16:22) ¡-­‑-­‑-­‑-­‑-­‑ ¡

Go ¡back ¡to ¡data ¡provider ¡ Check ¡if ¡ids ¡were ¡missing ¡ 8 ¡

slide-9
SLIDE 9

9 ¡

slide-10
SLIDE 10

10 ¡

slide-11
SLIDE 11

11 ¡

slide-12
SLIDE 12

¡

  • ­‑-­‑-­‑-­‑-­‑ ¡Mee&ng ¡Notes ¡(10/7/14 ¡16:22) ¡-­‑-­‑-­‑-­‑-­‑ ¡

Are ¡trip ¡dura&ons ¡reasonable? ¡ end ¡sta&on ¡is ¡empty ¡ bike ¡numbers ¡W343435 ¡v/s ¡0x343 ¡ weather ¡ ¡ how ¡oRen ¡do ¡people ¡forget ¡to ¡return ¡trips ¡ Model ¡trips ¡with ¡long ¡dura&ons ¡separately ¡ ¡ 12 ¡

slide-13
SLIDE 13

13 ¡

slide-14
SLIDE 14

14 ¡

slide-15
SLIDE 15

15 ¡

slide-16
SLIDE 16

16 ¡

slide-17
SLIDE 17

¡

  • ­‑-­‑-­‑-­‑-­‑ ¡Mee&ng ¡Notes ¡(10/7/14 ¡16:22) ¡-­‑-­‑-­‑-­‑-­‑ ¡

reorder ¡ 17 ¡

slide-18
SLIDE 18

18 ¡

slide-19
SLIDE 19

19 ¡

slide-20
SLIDE 20

20 ¡

slide-21
SLIDE 21

21 ¡

slide-22
SLIDE 22

22 ¡

slide-23
SLIDE 23

23 ¡

slide-24
SLIDE 24

24 ¡

slide-25
SLIDE 25

As ¡we ¡can ¡see, ¡there ¡is ¡a ¡giant ¡spike ¡around ¡0, ¡which ¡drowns ¡almost ¡everything ¡out, ¡but ¡ there ¡is ¡a ¡really ¡long ¡tail ¡where ¡the ¡max ¡inter-­‑arrival ¡&mes ¡are ¡really ¡long. ¡Part ¡of ¡the ¡ reason ¡that ¡max ¡&me ¡is ¡so ¡high ¡in ¡the ¡Boston ¡case ¡is ¡because ¡the ¡en&re ¡system ¡is ¡shut ¡ down ¡during ¡the ¡winter ¡months. ¡ This ¡combina&on ¡of ¡high ¡peak ¡around ¡zero ¡and ¡long ¡tail ¡indicates ¡a ¡strong ¡peak ¡load ¡ paXern ¡– ¡during ¡“rush ¡hours”, ¡there ¡are ¡a ¡lot ¡of ¡requests ¡to ¡the ¡system, ¡and ¡during ¡the ¡ night, ¡there ¡are ¡long ¡stretches ¡where ¡there ¡are ¡no ¡trips. ¡We ¡can ¡see ¡this ¡from ¡the ¡ graphs ¡in ¡slide ¡18 ¡as ¡well. ¡ 25 ¡

slide-26
SLIDE 26

Here ¡are ¡the ¡cdfs ¡for ¡the ¡same ¡data. ¡ This ¡is ¡preXy ¡useless, ¡so ¡let’s ¡switch ¡to ¡log ¡scales. ¡Unfortunately, ¡as ¡we ¡can ¡see ¡from ¡ the ¡pdf, ¡a ¡lot ¡of ¡the ¡inter-­‑arrival ¡&mes ¡are ¡zero, ¡so ¡we ¡need ¡to ¡strip ¡them ¡out ¡first. ¡ Ques&on: ¡is ¡that ¡OK? ¡How ¡do ¡we ¡address ¡zero ¡values ¡in ¡a ¡log ¡plot? ¡ ¡ 26 ¡

slide-27
SLIDE 27

That ¡at ¡least ¡shows ¡some ¡differen&a&on, ¡but ¡the ¡majority ¡of ¡trips ¡are ¡s&ll ¡around ¡0, ¡ which ¡corresponds ¡to ¡an ¡inter-­‑arrival ¡&me ¡of ¡1. ¡ 27 ¡

slide-28
SLIDE 28

This ¡is ¡the ¡complementary ¡log ¡plot. ¡Per ¡vern: ¡This ¡plots ¡the ¡*complementary* ¡CDF ¡(1-­‑ F(x)) ¡with ¡the ¡Y ¡axis ¡log-­‑scaled. ¡ ¡For ¡that, ¡an ¡exponen&al ¡distribu&on ¡will ¡be ¡a ¡straight ¡

  • line. ¡As ¡we ¡can ¡see, ¡for ¡the ¡Boston ¡case, ¡the ¡outlier ¡effect ¡is ¡so ¡strong ¡that ¡the ¡plot ¡is ¡

almost ¡a ¡straight ¡ver&cal ¡line. ¡How ¡do ¡we ¡deal ¡with ¡this? ¡log-­‑log ¡plot? ¡ The ¡Bay ¡Area ¡case ¡has ¡a ¡nicer ¡curve, ¡but ¡s&ll ¡really ¡concentrated ¡around ¡short ¡ interarrival ¡&mes. ¡ ¡ 28 ¡

slide-29
SLIDE 29

If ¡it ¡is ¡poisson, ¡we ¡would ¡expect ¡the ¡Q-­‑Q ¡plot ¡of ¡the ¡inter-­‑arrival ¡&mes ¡to ¡match ¡the ¡ exponen&al ¡distribu&on. ¡As ¡we ¡can ¡see, ¡we ¡are ¡not ¡even ¡close. ¡ ¡ 29 ¡

slide-30
SLIDE 30

There ¡is ¡a ¡much ¡beXer ¡match ¡for ¡the ¡pareto ¡distribu&on, ¡except ¡at ¡the ¡tails. ¡The ¡ comparison ¡is ¡also ¡distorted ¡by ¡a ¡couple ¡of ¡extreme ¡outliers. ¡I ¡could ¡replot ¡aRer ¡ removing ¡them, ¡but ¡they ¡appear ¡to ¡be ¡legi&mate ¡trips, ¡so ¡I ¡decided ¡to ¡move ¡to ¡sta&on ¡ specific ¡plots ¡anyway. ¡ ¡ 30 ¡

slide-31
SLIDE 31

Taking ¡logs ¡helps ¡reduce ¡the ¡effect ¡of ¡the ¡outlier, ¡but ¡there ¡are ¡s&ll ¡no ¡good ¡matches ¡

  • here. ¡

31 ¡

slide-32
SLIDE 32

Since ¡most ¡models ¡assume ¡sta&on ¡specific ¡poisson ¡rates, ¡let’s ¡look ¡at ¡sta&on ¡specific ¡ arrival ¡rates ¡rather ¡than ¡the ¡arrival ¡rate ¡of ¡the ¡whole ¡system. ¡ Here, ¡we ¡look ¡at ¡the ¡busiest ¡sta&ons ¡in ¡the ¡en&re ¡system ¡– ¡sta&on ¡22 ¡for ¡boston ¡and ¡ sta&on ¡70 ¡for ¡the ¡bay ¡area. ¡ 32 ¡

slide-33
SLIDE 33

There ¡is ¡no ¡match ¡for ¡the ¡poisson ¡(top ¡qq-­‑plot), ¡but ¡the ¡middle ¡part ¡of ¡the ¡pareto ¡looks ¡ preXy ¡good. ¡The ¡pareto ¡doesn’t ¡match ¡at ¡either ¡of ¡the ¡tails, ¡though. ¡Note ¡that ¡the ¡ lower ¡tail ¡is ¡actually ¡more ¡pronounced ¡because ¡we ¡had ¡to ¡strip ¡out ¡the ¡zeros ¡for ¡the ¡log ¡

  • plot. ¡

33 ¡

slide-34
SLIDE 34

These ¡are ¡the ¡plots ¡for ¡sta&on ¡15, ¡a ¡sta&on ¡with ¡one ¡of ¡the ¡lowest ¡loads. ¡We ¡can ¡see ¡a ¡ very ¡differently ¡shaped ¡cdf ¡here, ¡much ¡less ¡steep ¡around ¡zero ¡inter ¡arrival ¡&me. ¡ 34 ¡

slide-35
SLIDE 35

For ¡this ¡sta&on, ¡the ¡poisson ¡is ¡not ¡a ¡bad ¡fit, ¡although ¡the ¡pareto ¡is ¡s&ll ¡a ¡bit ¡beXer. ¡ 35 ¡

slide-36
SLIDE 36

These ¡are ¡the ¡curves ¡for ¡sta&on ¡67, ¡which ¡I ¡picked ¡randomly ¡using ¡the ¡randrange ¡ func&on. ¡It ¡is ¡a ¡lot ¡closer ¡to ¡the ¡busy ¡sta&on ¡than ¡the ¡idle ¡sta&on ¡in ¡terms ¡of ¡inter ¡

  • arrivals. ¡

36 ¡

slide-37
SLIDE 37

And ¡this ¡is ¡reflected ¡in ¡the ¡Q-­‑Q ¡plots ¡as ¡well. ¡ 37 ¡

slide-38
SLIDE 38

So ¡far, ¡we ¡have ¡been ¡looking ¡at ¡all ¡the ¡data, ¡across ¡large ¡&me ¡scales. ¡ However, ¡building ¡algorithms ¡based ¡on ¡smoothed ¡data ¡across ¡large ¡&me ¡scales ¡can ¡run ¡ into ¡issues ¡with ¡local ¡perturba&ons ¡that ¡don’t ¡match ¡the ¡smoothed ¡data. ¡ So ¡I ¡look ¡a ¡look ¡at ¡smaller ¡scale ¡data ¡as ¡well ¡and ¡saw ¡how ¡well ¡the ¡curves ¡matched. ¡ 38 ¡

slide-39
SLIDE 39

Here’s ¡the ¡varia&on ¡across ¡hours ¡on ¡each ¡day ¡of ¡Sep ¡2012 ¡(the ¡busiest ¡month) ¡of ¡the ¡ Boston ¡data. ¡We ¡can ¡see ¡that ¡although ¡the ¡two ¡humped ¡paXern ¡is ¡prety ¡consistent, ¡the ¡ magnitude ¡of ¡the ¡peaks ¡varies ¡– ¡some&mes, ¡the ¡first ¡one ¡is ¡much ¡smaller ¡than ¡the ¡ second ¡one ¡and ¡some&mes ¡it ¡is ¡not. ¡Even ¡the ¡shape ¡can ¡be ¡different ¡some&mes ¡– ¡ check ¡out ¡day ¡3 ¡or ¡day ¡5 ¡versus ¡the ¡same ¡day ¡in ¡other ¡weeks. ¡ 39 ¡

slide-40
SLIDE 40

Going ¡to ¡an ¡even ¡smaller ¡scale, ¡here’s ¡the ¡varia&on ¡over ¡hours ¡per ¡day ¡for ¡a ¡single ¡ sta&on ¡(22) ¡in ¡Boston ¡in ¡Sept ¡2012. ¡As ¡we ¡can ¡see, ¡the ¡curves ¡seem ¡a ¡lot ¡less ¡consistent ¡

  • here. ¡Not ¡just ¡the ¡curves, ¡but ¡also ¡the ¡magnitudes ¡are ¡very ¡different. ¡Consider ¡day ¡of ¡

week ¡= ¡4. ¡The ¡peak ¡appears ¡to ¡range ¡between ¡7 ¡and ¡40. ¡Planning ¡for ¡the ¡mean ¡will ¡fail ¡ miserably ¡since ¡the ¡pool ¡of ¡bikes ¡and ¡slots ¡is ¡not ¡infinite ¡– ¡an ¡unexpected ¡surge ¡will ¡ lead ¡to ¡exhaus&on. ¡ 40 ¡

slide-41
SLIDE 41

A ¡final ¡note ¡on ¡sta&c ¡versus ¡dynamic ¡rebalancing. ¡If ¡you ¡recall ¡the ¡material ¡from ¡slide ¡ 23 ¡– ¡in ¡sta&c ¡rebalancing, ¡the ¡rebalancing ¡trucks ¡run ¡overnight, ¡and ¡the ¡system ¡is ¡ assumed ¡to ¡be ¡in ¡stasis, ¡with ¡no ¡load, ¡during ¡the ¡run. ¡In ¡dynamic ¡rebalancing, ¡there ¡is ¡

  • ngoing ¡load ¡in ¡the ¡system. ¡There ¡is ¡an ¡interes&ng ¡mix ¡of ¡arrival ¡demand ¡assump&ons ¡

and ¡algorithms. ¡The ¡dynamic ¡algorithms ¡either ¡assume ¡homogenous ¡poisson, ¡or ¡(I ¡ think) ¡a ¡uniform ¡distribu&on. ¡The ¡sta&c ¡algorithms ¡assume ¡either ¡homogenous ¡or ¡non-­‑ homogenous ¡poission. ¡ ¡ What ¡I ¡wanted ¡to ¡show ¡in ¡this ¡slide ¡was ¡that ¡in ¡the ¡San ¡Francisco ¡case, ¡sta&c ¡ rebalancing ¡looks ¡like ¡it ¡will ¡help. ¡There ¡are ¡certain ¡sec&ons ¡that ¡are ¡clearly ¡trip ¡sources ¡ and ¡certain ¡sec&ons ¡that ¡are ¡trip ¡sinks, ¡and ¡so ¡you ¡would ¡want ¡to ¡rebalance ¡between ¡

  • them. ¡But ¡in ¡the ¡Boston ¡case, ¡we ¡don’t ¡see ¡such ¡a ¡paXern. ¡Incoming ¡and ¡outgoing ¡trips ¡

seem ¡preXy ¡evenly ¡balanced ¡at ¡all ¡sta&ons. ¡So ¡in ¡this ¡case, ¡the ¡unavailability ¡is ¡ primarily ¡caused ¡by ¡an ¡insufficiently ¡large ¡buffer, ¡and ¡dynamic ¡rebalancing ¡is ¡needed ¡to ¡ handle ¡availability. ¡ ¡I ¡think ¡that ¡there ¡is ¡the ¡opportunity ¡to ¡come ¡up ¡with ¡an ¡algorithm ¡ for ¡this ¡case ¡that ¡doesn’t ¡rely ¡on ¡homogenous ¡poisson. ¡ 41 ¡

slide-42
SLIDE 42

42 ¡