Web Science h#p://dl.acm.org/cita2on.cfm?id=1364782.1364798 CSCI - - PowerPoint PPT Presentation

web science
SMART_READER_LITE
LIVE PREVIEW

Web Science h#p://dl.acm.org/cita2on.cfm?id=1364782.1364798 CSCI - - PowerPoint PPT Presentation

Web Science h#p://dl.acm.org/cita2on.cfm?id=1364782.1364798 CSCI 470: Web Science Keith Vertanen Overview The web History Stats "Web science"


slide-1
SLIDE 1

Web ¡Science ¡

CSCI ¡470: ¡Web ¡Science ¡ ¡• ¡ ¡Keith ¡Vertanen ¡

h#p://dl.acm.org/cita2on.cfm?id=1364782.1364798 ¡

slide-2
SLIDE 2

Overview ¡

  • The ¡web ¡

– History ¡ – Stats ¡

  • "Web ¡science" ¡

– History ¡of ¡the ¡term ¡

  • What ¡we're ¡going ¡to ¡do ¡

– Course ¡details ¡ – Topics ¡

2 ¡

slide-3
SLIDE 3

A ¡short ¡history ¡of ¡the ¡web ¡

  • 1989 ¡Tim ¡Berners-­‑Lee ¡at ¡CERN ¡
  • 1990 ¡HTTP/0.9, ¡HTML, ¡URLs, ¡first ¡

text-­‑based ¡browser ¡

  • 1993 ¡Marc ¡Andreesen ¡releases ¡

NCSA ¡Mosaic, ¡graphical ¡browser ¡

  • 1993 ¡CERN ¡agrees ¡to ¡release ¡

protocol ¡royalty-­‑free ¡

  • 1994 ¡Andreesen ¡forms ¡Netscape ¡ ¡
  • 1994 ¡W3C ¡formed, ¡standardizing ¡

protocols, ¡encouraging ¡ interoperability ¡

3 ¡

slide-4
SLIDE 4

How ¡does ¡the ¡web ¡work? ¡

4 ¡

slide-5
SLIDE 5

What ¡is ¡the ¡web? ¡

  • "The ¡largest ¡human ¡informa2on ¡construct ¡in ¡
  • history. ¡The ¡web ¡is ¡transforming ¡society." ¡

– Web ¡Science ¡Trust ¡

5 ¡

1989 ¡ 2005 ¡

slide-6
SLIDE 6

How ¡big ¡is ¡the ¡web? ¡

  • "We've ¡known ¡it ¡for ¡a ¡long ¡2me: ¡the ¡web ¡is ¡big." ¡

– Google, ¡h#p://googleblog.blogspot.com/2008/07/we-­‑knew-­‑web-­‑was-­‑big.html ¡ ¡

¡

¡
  • Human ¡popula2on, ¡~7 ¡billion, ¡143 ¡pages/person ¡
  • 1 ¡billion ¡Google ¡searches/day ¡

6 ¡

Year ¡ Unique ¡URLs ¡ 1998 ¡ 26 ¡million ¡ 2000 ¡ 1 ¡billion ¡ 2004 ¡ 8 ¡billion ¡ 2008 ¡ 1 ¡trillion ¡

slide-7
SLIDE 7

h#p://funquisha.deviantart.com/art/ORIGAMI-­‑ZEBRA-­‑for-­‑real-­‑205044992 ¡

7 ¡

slide-8
SLIDE 8

8 ¡

slide-9
SLIDE 9

9 ¡

slide-10
SLIDE 10

10 ¡

slide-11
SLIDE 11

11 ¡

h#p://www.renesys.com/blog/2011/01/ egypt-­‑leaves-­‑the-­‑internet.shtml ¡

"What ¡happens ¡when ¡you ¡ disconnect ¡a ¡modern ¡ economy ¡and ¡80,000,000 ¡ people ¡from ¡the ¡ Internet?" ¡

slide-12
SLIDE 12

Demonstrators ¡in ¡Cairo's ¡Tahrir ¡Square, ¡February ¡8, ¡2011 ¡

12 ¡

slide-13
SLIDE 13

What ¡is ¡"web ¡science"? ¡

13 ¡

  • Science ¡2006 ¡

– MIT, ¡University ¡of ¡Southhampton ¡

slide-14
SLIDE 14

What ¡is ¡"web ¡science"? ¡

14 ¡

  • "Web ¡science…is ¡inherently ¡interdisciplinary ¡

and ¡integrates ¡computer ¡and ¡informa2on ¡ sciences ¡with ¡a ¡mul2tude ¡of ¡disciplines ¡ including ¡sociology, ¡economics, ¡poli2cal ¡ science, ¡law, ¡management, ¡language ¡and ¡ communica2on, ¡geography ¡and ¡psychology." ¡

¡

slide-15
SLIDE 15

This ¡course ¡

  • Focus ¡on ¡technical ¡side ¡

– Learn ¡interes2ng ¡technologies ¡ – Build ¡stuff ¡

  • Objec2ves ¡(from ¡the ¡course ¡catalog): ¡

– Understand ¡the ¡resources, ¡data ¡formats, ¡and ¡ protocols ¡used ¡in ¡the ¡Internet ¡ – Build ¡robust ¡and ¡load ¡balanced ¡client ¡server ¡ sokware ¡ ¡ – Understand ¡and ¡use ¡public/private ¡key ¡ cryptography ¡ – Understand ¡state ¡management ¡on ¡the ¡Internet ¡

15 ¡

slide-16
SLIDE 16

Course ¡ethos ¡

  • There ¡is ¡no ¡“one” ¡architecture ¡

– Only ¡choices ¡

  • Lots ¡of ¡choices ¡

– Choices ¡impact: ¡

  • Cost, ¡2me ¡to ¡market, ¡extensibility, ¡maintainability, ¡

reliability, ¡scalability, ¡… ¡

– Our ¡goal: ¡ ¡

  • Become ¡broadly ¡knowledgeable ¡in ¡architec2ng ¡web-­‑

based ¡sokware ¡solu2ons ¡

16 ¡

slide-17
SLIDE 17

Tenta2ve ¡topics ¡

  • Technologies ¡

– LAMP: ¡Linux ¡Apache ¡MySQL ¡PHP ¡ – Client-­‑side ¡scrip2ng, ¡e.g. ¡JavaScript ¡ – Server-­‑side ¡scrip2ng, ¡e.g. ¡PHP ¡ – HTML5 ¡ – Mobile ¡app ¡development ¡

  • Cloud ¡compu2ng ¡

– Running ¡your ¡own ¡virtual ¡server ¡ – Security! ¡

  • State ¡management ¡

– Storing ¡state ¡at ¡the ¡client ¡or ¡server ¡ – Cookies, ¡session ¡variables, ¡query ¡string, ¡databases ¡

17 ¡

slide-18
SLIDE 18

Tenta2ve ¡topics ¡

  • Dynamic ¡content ¡genera2on ¡

– CGI, ¡server-­‑side ¡scrip2ng, ¡web ¡server ¡modules, ¡servlets ¡

  • Web ¡services ¡

– SOAP, ¡REST ¡ – JSON ¡ – Ajax ¡

  • Crowdsourcing ¡

– Amazon ¡Mechanical ¡Turk ¡

  • Availability ¡ ¡

– Providing ¡fault ¡tolerance, ¡e.g. ¡99.999% ¡

  • Scalability ¡

– Scaling ¡to ¡million ¡or ¡billions ¡of ¡hits ¡

18 ¡

slide-19
SLIDE 19

Tenta2ve ¡topics ¡

  • Performance ¡

– How ¡to ¡measure, ¡e.g. ¡with ¡tools ¡like ¡Apache ¡Benchmark ¡ – How ¡to ¡improve, ¡e.g. ¡using ¡tools ¡like ¡memcahed ¡

  • Data ¡formats ¡

– Audio, ¡images, ¡video ¡

  • Compression ¡

– Makes ¡Nerlix/YouTube ¡work ¡on ¡today's ¡network ¡

  • Encryp2on ¡

– Symmetric ¡encryp2on, ¡e.g. ¡DES, ¡3DES, ¡AES ¡ – Public/private ¡encryp2on, ¡e.g. ¡SSL ¡ – Authen2ca2on ¡

19 ¡

slide-20
SLIDE 20

Tenta2ve ¡topics ¡

  • ??? ¡

20 ¡

slide-21
SLIDE 21

Project ¡details ¡

  • Project: ¡

– Due: ¡Wednesday ¡4/29 ¡ – Individual ¡or ¡pairs ¡

  • If ¡paired ¡then ¡twice ¡as ¡impressive ¡

– 15% ¡of ¡your ¡grade ¡ – No ¡late ¡days ¡

21 ¡

slide-22
SLIDE 22

Presenta2on ¡details ¡

  • Presenta2ons: ¡

– Last ¡two ¡days ¡of ¡class ¡ – ~15 ¡minutes/person ¡+ ¡ques2ons ¡ – Audio/visual ¡aids ¡and ¡demos ¡as ¡appropriate ¡ – 5% ¡of ¡your ¡grade ¡ – No ¡late ¡days ¡ ¡ ¡

22 ¡