Back-Office Web Traffic on the Internet Enric Pujol - - PowerPoint PPT Presentation

back office web traffic on the internet
SMART_READER_LITE
LIVE PREVIEW

Back-Office Web Traffic on the Internet Enric Pujol - - PowerPoint PPT Presentation

Back-Office Web Traffic on the Internet Enric Pujol TU-Berlin Philipp Richter TU-Berlin Balakrishnan Chandrasekaran Duke University Georgios


slide-1
SLIDE 1

Back-Office Web Traffic on the Internet

¡ Enric ¡Pujol ¡ ¡ ¡ TU-­‑Berlin ¡ ¡ Philipp ¡Richter ¡ ¡ ¡ TU-­‑Berlin ¡ ¡ Balakrishnan ¡Chandrasekaran ¡ ¡ Duke ¡University ¡ ¡ Georgios ¡Smaragdakis ¡ ¡ MIT ¡/ ¡TU-­‑Berlin ¡/ ¡Akamai ¡ ¡ Anja ¡Feldmann ¡ ¡ TU-­‑Berlin ¡ ¡ Bruce ¡Maggs ¡ ¡ ¡ Duke ¡University ¡/ ¡Akamai ¡ ¡ Keung-­‑Chi ¡Ng ¡ ¡ ¡ Akamai ¡

IMC ¡2014 ¡ Vancouver, ¡BC, ¡CANADA ¡ November ¡5-­‑7, ¡2014 ¡

slide-2
SLIDE 2

Internet ¡Measurement ¡Conference ¡2014

The Web for an end user

6.11.2014 2

The ¡front-­‑office Front-­‑office ¡Web ¡traffic: ¡ Web ¡traffic ¡between ¡end ¡users ¡and ¡servers

End$user

HTTP$GET

CDN Search$engine AdPublisher

slide-3
SLIDE 3

Internet ¡Measurement ¡Conference ¡2014

Behind the scenes...

6.11.2014 3

?

Back-­‑office ¡Web ¡traffic: ¡ Machine-­‑to-­‑machine ¡Web ¡traffic The ¡back-­‑office The ¡front-­‑office

End$user

HTTP$GET

CDN Search$engine AdPublisher

slide-4
SLIDE 4

Internet ¡Measurement ¡Conference ¡2014

Search engines: crawlers

6.11.2014 4

The ¡back-­‑office The ¡front-­‑office

HTTP$GET

Crawlers Content End$user

HTTP$GET

CDN Search$engine AdPublisher

slide-5
SLIDE 5

Internet ¡Measurement ¡Conference ¡2014

Content delivery: proxies

6.11.2014 5

The ¡back-­‑office The ¡front-­‑office

HTTP$GET

Crawlers Content

HTTP$GET$

Origin Overlay$of$proxies

HTTP$GET$

End$user

HTTP$GET

CDN Search$engine AdPublisher

slide-6
SLIDE 6

Internet ¡Measurement ¡Conference ¡2014

AdExchanges: real-time bidding

6.11.2014 6

The ¡back-­‑office The ¡front-­‑office

HTTP$GET

Crawlers Content

HTTP$GET$

Origin Overlay$of$proxies

HTTP$GET$ HTTP$POST

Advertisers/bidders Auctioneer AdExchange End$user

HTTP$GET

CDN Search$engine AdPublisher

slide-7
SLIDE 7

Internet ¡Measurement ¡Conference ¡2014

Agenda

  • 1. Introduction ¡
  • 2. Methodology ¡and ¡datasets ¡
  • 3. Characteristics ¡

1. Traffic ¡ 2. Patterns ¡ 3. Inter-­‑domain ¡perspective ¡

  • 4. CDN ¡back-­‑office ¡traffic ¡
  • 5. The ¡end-­‑user ¡perspective ¡
  • 6. Summary ¡and ¡implications

6.11.2014 7

slide-8
SLIDE 8

Internet ¡Measurement ¡Conference ¡2014

Vantage points (VP)

Diverse ¡vantage ¡points: ¡multiple ¡perspectives

6.11.2014 8

Type VP Daily ¡traffic Observations IXPs L-­‑IXP 11,900 ¡TB SFlow ¡(1/16K) M-­‑IXP 1,580 ¡TB Transit BBone-­‑1 40 ¡TB Packet ¡sampled ¡(1/1K) BBone-­‑2 70 ¡TB Content CDN 350 ¡TB 5 ¡locations Eyeballs RBN 35 ¡TB Packet ¡dumps

slide-9
SLIDE 9

Internet ¡Measurement ¡Conference ¡2014

Candidate IPs for the back-office

6.11.2014 9

Send ¡and ¡receive ¡requests

Dual ¡role ¡IPs ¡are ¡prime ¡candidates

slide-10
SLIDE 10

Internet ¡Measurement ¡Conference ¡2014

Candidate IPs for the back-office

6.11.2014 10

Send ¡and ¡receive ¡requests Send ¡and ¡receive ¡requests

Dual ¡role ¡IPs ¡are ¡prime ¡candidates

slide-11
SLIDE 11

Internet ¡Measurement ¡Conference ¡2014

Candidate IPs for the back-office

6.11.2014 11

Many ¡requests ¡to ¡many ¡servers

Heavy ¡hitter ¡IPs ¡are ¡also ¡prime ¡candidates

slide-12
SLIDE 12

Internet ¡Measurement ¡Conference ¡2014

Candidate IPs for the back-office

6.11.2014 12

Many ¡requests ¡to ¡many ¡servers Many ¡requests ¡to ¡a ¡few ¡servers

Heavy ¡hitter ¡IPs ¡are ¡also ¡prime ¡candidates

slide-13
SLIDE 13

Internet ¡Measurement ¡Conference ¡2014

Sources of back-office Web traffic

6.11.2014 13

Heavy ¡hitters Dual ¡role ¡IPs

L-­‑IXP

slide-14
SLIDE 14

Internet ¡Measurement ¡Conference ¡2014

Sources of back-office Web traffic

6.11.2014 14

Heavy ¡hitters Dual ¡role ¡IPs

L-­‑IXP L-­‑IXP

Real-­‑time ¡ bidding? Crawling? ?

slide-15
SLIDE 15

Internet ¡Measurement ¡Conference ¡2014

Dual-role IPs: active measurements

Observations: ¡

1. Most ¡IPs ¡have ¡only ¡client ¡behavior ¡ 2. Many ¡servers ¡also ¡show ¡client ¡behavior ¡

Active ¡measurements ¡augment ¡the ¡number ¡of ¡servers

6.11.2014 15

Client ¡only ¡(%) Server ¡only ¡(%) Dual-­‑role ¡(%)

L-­‑IXP Passive 96.90 2.74 0.36 Passive+Active 93.85 2.74 3.40

ZMap ¡project: ¡Internet-­‑wide ¡scan ¡of ¡Web ¡Servers ¡(scans.io)

slide-16
SLIDE 16

Internet ¡Measurement ¡Conference ¡2014

Candidates: manual classification

Crawlers: ¡

  • Reverse ¡DNS ¡+ ¡Origin ¡AS ¡

Auctioneers: ¡

  • URL ¡+ ¡Origin ¡AS ¡

Content ¡Delivery ¡Proxies: ¡

  • Origin ¡AS ¡+ ¡Reverse ¡DNS ¡(for ¡caches) ¡

Other: ¡

  • Rest ¡of ¡dual-­‑role ¡IPs

6.11.2014 16

3.9K ¡IPs, ¡74% ¡in ¡2 ¡orgs 316 ¡IPs, ¡4 ¡orgs 36K ¡IPs, ¡8 ¡orgs L

  • ­‑

I X P 151K ¡IPs, ¡mostly ¡in ¡cloud ¡prov. L

  • ­‑

I X P L

  • ­‑

I X P L

  • ­‑

I X P

slide-17
SLIDE 17

Internet ¡Measurement ¡Conference ¡2014

Candidates: manual classification

Crawlers: ¡

  • Reverse ¡DNS ¡+ ¡Origin ¡AS ¡

Auctioneers: ¡

  • URL ¡+ ¡Origin ¡AS ¡

Content ¡Delivery ¡Proxies: ¡

  • Origin ¡AS ¡+ ¡Reverse ¡DNS ¡(for ¡caches) ¡

Other: ¡

  • Rest ¡of ¡dual-­‑role ¡IPs

6.11.2014 17

3.9K ¡IPs, ¡74% ¡in ¡2 ¡orgs 316 ¡IPs, ¡4 ¡orgs 36K ¡IPs, ¡8 ¡orgs L

  • ­‑

I X P 151K ¡IPs, ¡mostly ¡in ¡cloud ¡prov. L

  • ­‑

I X P L

  • ­‑

I X P L

  • ­‑

I X P

slide-18
SLIDE 18

Internet ¡Measurement ¡Conference ¡2014

Candidates: manual classification

Crawlers: ¡

  • Reverse ¡DNS ¡+ ¡Origin ¡AS ¡

Auctioneers: ¡

  • URL ¡+ ¡Origin ¡AS ¡

Content ¡Delivery ¡Proxies: ¡

  • Origin ¡AS ¡+ ¡Reverse ¡DNS ¡(for ¡caches) ¡

Other: ¡

  • Rest ¡of ¡dual-­‑role ¡IPs

6.11.2014 18

3.9K ¡IPs, ¡74% ¡in ¡2 ¡orgs 316 ¡IPs, ¡4 ¡orgs 36K ¡IPs, ¡8 ¡orgs L

  • ­‑

I X P 151K ¡IPs, ¡mostly ¡in ¡cloud ¡prov. L

  • ­‑

I X P L

  • ­‑

I X P L

  • ­‑

I X P

slide-19
SLIDE 19

Internet ¡Measurement ¡Conference ¡2014

Candidates: manual classification

Crawlers: ¡

  • Reverse ¡DNS ¡+ ¡Origin ¡AS ¡

Auctioneers: ¡

  • URL ¡+ ¡Origin ¡AS ¡

Content ¡Delivery ¡Proxies: ¡

  • Origin ¡AS ¡+ ¡Reverse ¡DNS ¡(for ¡caches) ¡

Other: ¡

  • Rest ¡of ¡dual-­‑role ¡IPs

6.11.2014 19

3.9K ¡IPs, ¡74% ¡in ¡2 ¡orgs 316 ¡IPs, ¡4 ¡orgs 36K ¡IPs, ¡8 ¡orgs L

  • ­‑

I X P 151K ¡IPs, ¡mostly ¡in ¡cloud ¡prov. L

  • ­‑

I X P L

  • ­‑

I X P L

  • ­‑

I X P

slide-20
SLIDE 20

Internet ¡Measurement ¡Conference ¡2014

Agenda

  • 1. Introduction ¡
  • 2. Methodology ¡and ¡datasets ¡
  • 3. Characteristics ¡

1. Traffic ¡ 2. Patterns ¡ 3. Inter-­‑domain ¡perspective ¡

  • 4. CDN ¡back-­‑office ¡traffic ¡
  • 5. The ¡end-­‑user ¡perspective ¡
  • 6. Summary ¡and ¡implications

6.11.2014 20

slide-21
SLIDE 21

Internet ¡Measurement ¡Conference ¡2014

Traffic

At ¡least ¡10% ¡in ¡our ¡VPs

6.11.2014 21

IXPs: ¡from ¡10% ¡to ¡20% Transit ¡links: ¡different ¡obs.

slide-22
SLIDE 22

Internet ¡Measurement ¡Conference ¡2014

Traffic: Contribution per class

Observations: ¡

1. CDPs ¡ ¡ ¡ ¡ big ¡players ¡– ¡ ¡significant ¡share ¡ ¡ 2. Real-­‑time ¡bidding ¡ ¡ many ¡but ¡small ¡transactions ¡ 3. Crawlers ¡ ¡ ¡ ¡ a ¡few ¡orgs ¡– ¡significant ¡share ¡ 4. Other ¡ ¡ ¡ ¡ cloud ¡service ¡providers ¡

All ¡classes ¡contribute. ¡More ¡to ¡discover

6.11.2014 22

CDPs Auctioneers Crawlers Other L-­‑IXP Bytes 12.1 ¡% 1.1 ¡% 10.3 ¡% 76.5 ¡% Requests 11.8 ¡% 22.5 ¡% 15.1 ¡% 50.6 ¡%

slide-23
SLIDE 23

Internet ¡Measurement ¡Conference ¡2014

Traffic patterns: bytes

6.11.2014 23

% ¡back-­‑office ¡Web ¡traffic ¡increases ¡during ¡off ¡hours ¡in ¡IXPs

slide-24
SLIDE 24

Internet ¡Measurement ¡Conference ¡2014

Traffic patterns: requests

Observations: ¡

  • 1. A ¡multiplicative ¡factor ¡of ¡human ¡activity ¡(e.g., ¡RTB) ¡
  • 2. Non-­‑human ¡triggered ¡activity ¡(e.g., ¡crawlers)

6.11.2014 24

L-­‑IXP

slide-25
SLIDE 25

Internet ¡Measurement ¡Conference ¡2014

Inter-domain perspective

6.11.2014 25

Back-­‑office ¡traffic ¡appears ¡in ¡many ¡peering ¡links

Top ¡10 ¡traffic ¡carrying ¡links: ¡

4 ¡x ¡Cloud ¡– ¡Content ¡ 3 ¡x ¡Search ¡– ¡Hosters ¡ 2 ¡x ¡CDN ¡– ¡Content ¡ ¡ 1 ¡x ¡Content ¡– ¡Advertisement ¡

L-­‑IXP

slide-26
SLIDE 26

Internet ¡Measurement ¡Conference ¡2014

Agenda

  • 1. Introduction ¡
  • 2. Methodology ¡and ¡datasets ¡
  • 3. Characteristics ¡

1. Traffic ¡ 2. Patterns ¡ 3. Inter-­‑domain ¡perspective ¡

  • 4. CDN ¡back-­‑office ¡traffic ¡
  • 5. The ¡end-­‑user ¡perspective ¡
  • 6. Summary ¡and ¡implications

6.11.2014 26

slide-27
SLIDE 27

Internet ¡Measurement ¡Conference ¡2014

A CDN perspective

6.11.2014 27

CDN$front*end CDN$cluster End*user

Front&office Public Private Origin

Origin CDN$back*end CDN$back*end

Three ¡sub-­‑classes ¡of ¡back-­‑office ¡traffic

slide-28
SLIDE 28

Internet ¡Measurement ¡Conference ¡2014

A CDN perspective

Public: ¡front-­‑end ¡back-­‑end ¡over ¡the ¡Internet

6.11.2014 28

CDN$front*end CDN$cluster End*user

Front&office Public Private Origin

Origin CDN$back*end CDN$back*end

slide-29
SLIDE 29

Internet ¡Measurement ¡Conference ¡2014

A CDN perspective

Private: ¡within ¡same ¡cluster

6.11.2014 29

CDN$front*end CDN$cluster End*user

Front&office Public Private Origin

Origin CDN$back*end CDN$back*end

slide-30
SLIDE 30

Internet ¡Measurement ¡Conference ¡2014

A CDN perspective

Origin: ¡inter-­‑organization ¡over ¡the ¡Internet

6.11.2014 30

CDN$front*end CDN$cluster End*user

Front&office Public Private Origin

Origin CDN$back*end CDN$back*end

slide-31
SLIDE 31

Internet ¡Measurement ¡Conference ¡2014

Back-office per location

6.11.2014 31

Front-­‑office Back-­‑office: ¡ORIGIN Back-­‑office: ¡PUBLIC Back-­‑office: ¡PRIVATE Edge ¡cluster Regional ¡hub

CDNs ¡heavily ¡rely ¡on ¡back-­‑office ¡traffic

slide-32
SLIDE 32

Internet ¡Measurement ¡Conference ¡2014

Agenda

  • 1. Introduction ¡
  • 2. Methodology ¡and ¡datasets ¡
  • 3. Characteristics ¡

1. Traffic ¡ 2. Patterns ¡ 3. Inter-­‑domain ¡perspective ¡

  • 4. CDN ¡back-­‑office ¡traffic ¡
  • 5. The ¡end-­‑user ¡perspective ¡
  • 6. Summary ¡and ¡implications

6.11.2014 32

slide-33
SLIDE 33

Internet ¡Measurement ¡Conference ¡2014

The end-user perspective

6.11.2014 33

Residential ¡broadband ¡network: ¡backbone ¡latency ¡(no ¡access)

Trans-­‑continental Continental Local

A ¡smaller ¡front-­‑office: ¡but ¡the ¡back-­‑office ¡may ¡be ¡large

slide-34
SLIDE 34

Internet ¡Measurement ¡Conference ¡2014

Summary

  • 1. A ¡back-­‑office ¡to ¡support ¡the ¡Web ¡
  • 2. Significant ¡traffic: ¡bytes ¡and ¡requests ¡
  • 3. Different ¡type ¡of ¡traffic ¡patterns ¡
  • 4. Visible ¡at ¡multiple ¡peering ¡links

6.11.2014 34

An ¡important ¡yet ¡understudied ¡class ¡of ¡traffic

slide-35
SLIDE 35

Internet ¡Measurement ¡Conference ¡2014

Implications

Feasibility ¡to ¡deploy ¡new ¡protocols: ¡

  • It ¡is ¡easier ¡to ¡change ¡the ¡back ¡office ¡than ¡the ¡front ¡office ¡

Performance ¡evaluation: ¡ ¡

  • Interactions ¡with ¡the ¡back ¡office ¡
  • More ¡users ¡than ¡anticipated ¡

Opportunities: ¡

  • ISPs: ¡micro-­‑data ¡centers, ¡virtualized ¡services ¡
  • IXPs: ¡co-­‑location ¡strategies ¡
  • NSPs: ¡new ¡services ¡e.g., ¡SLAs

6.11.2014 35

slide-36
SLIDE 36

Internet ¡Measurement ¡Conference ¡2014

Implications

Feasibility ¡to ¡deploy ¡new ¡protocols: ¡

  • It ¡is ¡easier ¡to ¡change ¡the ¡back ¡office ¡than ¡the ¡front ¡office ¡

Performance ¡evaluation: ¡ ¡

  • Interactions ¡with ¡the ¡back ¡office ¡
  • More ¡users ¡than ¡anticipated ¡

Opportunities: ¡

  • ISPs: ¡micro-­‑data ¡centers, ¡virtualized ¡services ¡
  • IXPs: ¡co-­‑location ¡strategies ¡
  • NSPs: ¡new ¡services ¡e.g., ¡SLAs

6.11.2014 36

slide-37
SLIDE 37

Internet ¡Measurement ¡Conference ¡2014

Implications

Feasibility ¡to ¡deploy ¡new ¡protocols: ¡

  • It ¡is ¡easier ¡to ¡change ¡the ¡back ¡office ¡than ¡the ¡front ¡office ¡

Performance ¡evaluation: ¡ ¡

  • Interactions ¡with ¡the ¡back ¡office ¡
  • More ¡users ¡than ¡anticipated ¡

Opportunities: ¡

  • ISPs: ¡micro-­‑data ¡centers, ¡virtualized ¡services ¡
  • IXPs: ¡co-­‑location ¡strategies ¡
  • NSPs: ¡new ¡services ¡e.g., ¡SLAs

6.11.2014 37

slide-38
SLIDE 38

Internet ¡Measurement ¡Conference ¡2014

Back-office traffic on the Internet

6.11.2014 38

The ¡back-­‑office ¡(some ¡examples ¡thereof) The ¡front-­‑office

HTTP$GET

Crawlers Content

HTTP$GET$

Origin Overlay$of$proxies

HTTP$GET$ HTTP$POST

Advertisers/bidders Auctioneer AdExchange End$user

HTTP$GET

CDN Search$engine AdPublisher