Democra(zing Data Science Sophie Chou William Li Ramesh - - PowerPoint PPT Presentation

democra zing data science
SMART_READER_LITE
LIVE PREVIEW

Democra(zing Data Science Sophie Chou William Li Ramesh - - PowerPoint PPT Presentation

Democra(zing Data Science Sophie Chou William Li Ramesh Sridharan @mpe(tchou @williampli @tweetsbyramesh {soph,wpli,rameshvs}@mit.edu Some Links Paper:


slide-1
SLIDE 1

Democra(zing ¡Data ¡Science ¡

Sophie ¡Chou ¡ @mpe(tchou ¡ William ¡Li ¡ @williampli ¡ Ramesh ¡Sridharan ¡ @tweetsbyramesh ¡ {soph,wpli,rameshvs}@mit.edu ¡

slide-2
SLIDE 2

Some ¡Links ¡

  • Paper: ¡bit.ly/DDSpaper ¡
  • Cathy ¡O’Neil’s ¡Blog ¡(@mathbabedotorg): ¡bit.ly/DDSblog ¡
  • TwiMer: ¡@mpe3tchou, ¡@williampli, ¡@tweetsbyramesh ¡

2 ¡

slide-3
SLIDE 3

[insert technology] ¡for ¡Social ¡Good ¡

Technology ¡is ¡a ¡force ¡mul(plier, ¡ ¡ for ¡beMer ¡or ¡worse ¡

3 ¡

slide-4
SLIDE 4

What ¡is ¡Data ¡Science? ¡

  • Our ¡working ¡defini(on: ¡transforming ¡data ¡into ¡

insights/solu(ons/products ¡

  • 1. collec(on ¡& ¡storage ¡
  • 2. cleaning ¡& ¡structuring ¡
  • 3. analyzing ¡& ¡finding ¡paMerns ¡
  • 4. visualizing ¡& ¡communica(ng ¡results ¡

4 ¡

slide-5
SLIDE 5

What ¡is ¡“Democra(zing ¡Data ¡Science”? ¡

The ¡applica(on ¡of ¡data ¡science ¡is ¡undemocra(c: ¡ ¡ problems ¡that ¡promote ¡the ¡common ¡good ¡ receive ¡insufficient ¡aMen(on. ¡

5 ¡

slide-6
SLIDE 6

Ford/MacArthur ¡Founda(on, ¡2013 ¡ ¡

“Technology ¡talent ¡is ¡a ¡key ¡need ¡in ¡ government ¡and ¡civil ¡society, ¡ ¡ but ¡the ¡current ¡state ¡of ¡the ¡pipeline ¡is ¡ inadequate ¡to ¡meet ¡that ¡need.” ¡

¡ ¡

Source: ¡hMp://bit.ly/FordMacArthurReport ¡

6 ¡

slide-7
SLIDE 7

Why? ¡

misalloca3on ¡

  • f ¡data ¡science ¡

lack ¡of ¡diversity ¡ in ¡data ¡science ¡ incen(ves ¡for ¡ data ¡scien(sts ¡ data ¡science ¡ educa(on ¡

7 ¡

slide-8
SLIDE 8

Outline ¡

  • Incen(ves ¡for ¡data ¡scien(sts ¡
  • Democra(zing ¡data ¡science ¡educa(on ¡
  • Poten(al ¡solu(ons ¡

8 ¡

slide-9
SLIDE 9

Sources ¡of ¡Power ¡in ¡Data ¡Science ¡

capital ¡ data ¡ people ¡

9 ¡

slide-10
SLIDE 10

Human ¡exper(se ¡

¡ ¡ “...[salaries] ¡between ¡$200,000 ¡ and ¡$300,000 ¡a ¡year…100 ¡ recruiter ¡emails ¡a ¡day” ¡ ¡ “...working ¡for ¡a ¡consumer ¡ Internet ¡firm ¡can ¡be ¡surprisingly ¡ rewarding.” ¡

Source: ¡hMp://bit.ly/WSJDataScience ¡

10 ¡

slide-11
SLIDE 11

Sources ¡of ¡Power ¡in ¡Data ¡Science ¡

capital ¡ data ¡ people ¡

11 ¡

slide-12
SLIDE 12

Outline ¡

  • Structural ¡inequali(es ¡in ¡data ¡science ¡
  • Democra(zing ¡data ¡science ¡educa(on ¡
  • Poten(al ¡solu(ons ¡

12 ¡

slide-13
SLIDE 13

Nega(ve ¡feedback ¡loop ¡

Lack ¡of ¡ diversity ¡in ¡ data ¡scien(sts ¡ Lack ¡of ¡ diversity ¡in ¡ educa(on ¡ Lack ¡of ¡ diversity ¡in ¡ applica(on ¡

13 ¡

slide-14
SLIDE 14

Why ¡care? ¡

  • Diversity ¡is ¡key ¡to ¡innova(on ¡

(Forbes ¡Insights, ¡2011) ¡

  • Lack ¡of ¡diversity ¡perpetuates ¡

misalloca(on ¡

14 ¡

slide-15
SLIDE 15

Racial ¡inequality ¡in ¡science ¡and ¡engineering ¡

  • Misrepresenta(on ¡isn’t ¡

going ¡away ¡

  • Fewer ¡minori(es ¡

receive ¡degrees ¡

15 ¡

Source: ¡NSF ¡Science ¡and ¡Engineering ¡Indicators ¡2014 ¡

slide-16
SLIDE 16

Women ¡in ¡Compu(ng ¡

  • 1985: ¡37% ¡

2000: ¡29% ¡ 2014: ¡18% ¡

  • 2000 ¡to ¡2014: ¡

– 5% ¡decrease ¡in ¡math ¡ – 2% ¡decrease ¡in ¡engineering ¡

16 ¡

Source: ¡NSF ¡Science ¡and ¡Engineering ¡Indicators ¡2014 ¡

slide-17
SLIDE 17

Graduate ¡degrees ¡

  • Women ¡fare ¡even ¡

worse ¡

  • 2x ¡as ¡many ¡white ¡males ¡

receiving ¡degrees ¡as ¡all ¡ minori:es ¡combined ¡

  • Only ¡1 ¡in ¡5 ¡PhDs ¡female ¡

Source: ¡NSF ¡Science ¡and ¡Engineering ¡Indicators ¡2014 ¡

17 ¡

slide-18
SLIDE 18

Unlocking ¡the ¡Clubhouse: ¡A ¡Case ¡Study ¡

  • 2014 ¡incoming ¡

class: ¡40% ¡women ¡

Source: ¡Unlocking ¡the ¡Clubhouse, ¡2002 ¡

18 ¡

slide-19
SLIDE 19

Triggering ¡Posi(ve ¡Change ¡

“insuring ¡science ¡and ¡technology ¡are ¡considered ¡in ¡ their ¡social ¡context ¡may ¡be ¡the ¡most ¡important ¡ change ¡that ¡can ¡be ¡made ¡in ¡science ¡teaching ¡for ¡all ¡ people, ¡both ¡male ¡and ¡female.” ¡ ¡

Source: ¡Taggart ¡& ¡O’Gara, ¡2000 ¡

19 ¡

slide-20
SLIDE 20

Posi(ve ¡feedback ¡loop ¡

Relevant ¡ applica(ons ¡ Increase ¡ educa(onal ¡

  • pportuni(es ¡

AMract ¡diverse ¡ demographics ¡

20 ¡

slide-21
SLIDE 21

Outline ¡

  • Structural ¡inequali(es ¡in ¡data ¡science ¡
  • Democra(zing ¡data ¡science ¡educa(on ¡
  • Poten(al ¡solu(ons ¡

21 ¡

slide-22
SLIDE 22

Technologies ¡

  • Recent ¡technologies ¡target ¡

broader ¡audiences ¡

  • Ooen ¡require ¡significant ¡

technical ¡literacy ¡

  • Can ¡we ¡broaden ¡access ¡

further ¡s(ll? ¡

22 ¡

slide-23
SLIDE 23

Crowd-­‑based ¡efforts ¡

  • Machine ¡learning ¡compe((ons ¡

– Can ¡promote ¡meaningful ¡problems ¡ – Low ¡barrier ¡to ¡entry ¡

  • Ooen ¡run ¡by ¡for-­‑profit ¡en((es ¡
  • Can ¡we ¡encourage ¡more ¡ini(a(ves ¡

like ¡KDD ¡Cup ¡2014? ¡

23 ¡

slide-24
SLIDE 24

Educa(on: ¡MOOCs ¡

  • Tremendous ¡poten(al ¡for ¡

reaching ¡students ¡

  • Most ¡ooen ¡taken ¡by ¡

professionals ¡and ¡people ¡ with ¡graduate ¡degrees ¡

24 ¡

slide-25
SLIDE 25

Private ¡Sector ¡Opportuni(es ¡

  • Reaching ¡out ¡to ¡underserved ¡groups ¡

– Tap ¡new ¡markets ¡

  • Pro ¡bono ¡work ¡could ¡service ¡groups ¡and ¡bring ¡in ¡

new ¡customers ¡

  • Meaningful ¡“small ¡data” ¡to ¡serve ¡the ¡long ¡tail ¡

25 ¡

slide-26
SLIDE 26

Academic ¡Research ¡

  • Research ¡promo(ng ¡social ¡good ¡is ¡par(cularly ¡

accessible ¡to ¡academics ¡

– Social ¡welfare ¡problems ¡ooen ¡rely ¡on ¡public ¡data ¡ – Academia ¡is ¡well-­‑suited ¡to ¡interdisciplinary ¡ research ¡

  • Need ¡for ¡focus ¡on ¡meaningful ¡problems ¡

26 ¡

slide-27
SLIDE 27

Your ¡Solu(on ¡Here! ¡

  • We ¡believe ¡the ¡community ¡has ¡a ¡responsibility ¡to ¡

solve ¡these ¡problems ¡

  • Exper(se ¡in ¡policy, ¡business, ¡sta(s(cs, ¡

healthcare, ¡computer ¡science ¡will ¡all ¡be ¡crucial ¡

  • Undemocra(c ¡inequali(es ¡persist ¡in ¡data ¡science ¡

applica(ons ¡

  • All ¡of ¡us ¡can ¡be ¡part ¡of ¡the ¡solu(on ¡

@mpe(tchou ¡ ¡@williampli ¡ ¡@tweetsbyramesh ¡

27 ¡