Making Sense at Scale with Algorithms, Machines & People
PI: Michael Franklin
University of California, Berkeley
- Expeditions in Computing PI Meeting
May 15, 2013
UC ¡BERKELEY ¡
Making Sense at Scale with Algorithms, Machines & People PI: - - PowerPoint PPT Presentation
UC BERKELEY Making Sense at Scale with Algorithms, Machines & People PI: Michael Franklin University of California, Berkeley Expeditions in Computing PI Meeting May 15, 2013 The Berkeley AMPLab 2 Sources
UC ¡BERKELEY ¡
2
It’s ¡All ¡Happening ¡On-‑line ¡
Every: Click Ad impression Billing event Fast Forward, pause,… Friend Request Transaction Network message Fault …
User ¡Generated ¡(Web ¡& ¡ Mobile) ¡
Internet ¡of ¡Things ¡/ ¡M2M ¡ ScienCfic ¡CompuCng ¡
Projected ¡Growth ¡ Increase ¡over ¡2010 ¡
0 ¡ 10 ¡ 20 ¡ 30 ¡ 40 ¡ 50 ¡ 60 ¡ 2010 ¡ 2011 ¡ 2012 ¡ 2013 ¡ 2014 ¡ 2015 ¡ Moore's ¡Law ¡ Overall ¡Data ¡ Par8cle ¡Accel. ¡ DNA ¡Sequencers ¡
[IDC ¡report, ¡Kathy ¡Yelick, ¡LBNL] ¡
8
Alex ¡Bayen ¡(Mobile ¡Sensing) ¡ Anthony ¡Joseph ¡(Sec./ ¡Privacy) ¡ Ken ¡Goldberg ¡(Crowdsourcing) ¡ Randy ¡Katz ¡(Systems) ¡ *Michael ¡Franklin ¡(Databases) ¡ Dave ¡Pa`erson ¡(Systems) ¡ Armando ¡Fox ¡(Systems) ¡ *Ion ¡Stoica ¡(Systems) ¡ *Mike ¡Jordan ¡(Machine ¡Learning) ¡ Sco` ¡Shenker ¡(Networking) ¡
10
12
13
MPI ¡ Resource ¡
Data ¡ ¡ Processing ¡ Storm ¡
Spark Spark Streaming Shark BlinkDB
¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡HDFS ¡ Data ¡
Tachyon
Hadoop ¡
HIVE ¡
Pig ¡
Spark Graph ML base Released ¡(BDAS) ¡ In ¡development ¡(BDAS) ¡ Exis8ng ¡open ¡source ¡stack ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ BDAS ¡Components ¡being ¡released ¡under ¡BSD ¡or ¡Apache ¡Open ¡Source ¡License ¡
15
16
Logistic Regression Performance
29 GB dataset on 20 EC2 m1.xlarge machines (4 cores each)
18
19
Disk 2 Disk 1
Parser Optimizer Statistics
CrowdSQL Results
Executor
Files Access Methods
UI Template Manager Form Editor UI Creation HIT Manager MetaData Turker Relationship Manager
21
AMPCamp I @ Berkeley, August 2012 AMPCamp II @ Strata Conf., Feb 2013 AMPCamp III @ Berkeley, August 2013 AMPCamp Online: ampcamp.berkeley.edu
22