machine learning and computational social science
play

Machine Learning and Computational Social Science - PowerPoint PPT Presentation

Machine Learning and Computational Social Science Intersections and Collisions David Jensen Department of Computer Science University of Massachusetts Amherst 17 December 2011


  1. Machine ¡Learning ¡and ¡ Computational ¡Social ¡Science Intersections ¡and ¡Collisions David ¡Jensen Department ¡of ¡Computer ¡Science University ¡of ¡Massachusetts ¡Amherst 17 ¡December ¡2011

  2. 1202

  3. Introduced ¡new ¡representations ¡and ¡algorithms 0 ¡ ¡1 ¡ ¡2 ¡ ¡3 ¡ ¡4 ¡ ¡5 ¡ ¡6 ¡ ¡7 ¡ ¡8 ¡ ¡9 ¡ ¡ ¡ CCXXVI 226 226 = ¡(2 ¡x ¡100) ¡+ ¡(2 ¡x ¡10) ¡+ ¡6 ¡ 226 382 + ¡471 x ¡16 ⅜ ¡+ ¼ ¡= ¡ ⅝ ¡ 697 6112

  4. Displaced ¡existing ¡methods

  5. Computational ¡ Social ¡Science

  6. Decomposing ¡research ¡problems Agent Task Behavior Environment

  7. Example Agent Agent Task Task Person Job-­‑hunting Behavior Behavior Exploiting ¡the strength ¡of weak ¡ties (Granovetter ¡1973) Environment Environment Social ¡network ¡of ¡friends ¡and ¡acquaintances

  8. Traditional ¡social ¡science Agent Agent Task Task Scientists Understand ¡the ¡ behavior ¡of ¡ social ¡systems Behavior Behavior Current ¡research ¡ practices ¡in ¡ social ¡science ¡ Environment Environment Available ¡data ¡and ¡analytic ¡methods

  9. Computational ¡social ¡science Agent Agent Task Scientists Scientist Understand ¡the ¡ + ¡Computation behavior ¡of ¡ social ¡systems Behavior Behavior New ¡research ¡ Current ¡research ¡ practices ¡in ¡ practices ¡in ¡ social ¡science ¡ social ¡science ¡ Environment Environment Environment Available ¡data ¡and ¡analytic ¡methods Available ¡data ¡and ¡analytic ¡methods Available ¡data ¡and ¡analytic ¡methods

  10. Computational ¡social ¡science Social ¡scientists ¡+ ¡ Computer ¡scientists ¡+ ¡ Agent Task Statisticians ¡+ ¡others Scientists Understand ¡the ¡ + ¡Computation behavior ¡of ¡ Representations ¡+ ¡ social ¡systems Algorithms Behavior New ¡research ¡ practices ¡in ¡ social ¡science ¡ Environment Available ¡data ¡and ¡analytic ¡methods

  11. Key ¡question Given ¡the ¡ environment ¡and ¡ task , ¡ what ¡ representations ¡and ¡algorithms are ¡most ¡appropriate? Also: What ¡new ¡ tasks ¡can ¡we ¡accomplish, ¡ given ¡agents ¡and ¡environments? What ¡new ¡ environments ¡can ¡be ¡studied, ¡ given ¡existing ¡tasks ¡and ¡agents

  12. Key ¡points • The ¡ environments ¡and ¡ tasks ¡of ¡social ¡science ¡ make ¡new ¡requirements ¡on ¡the ¡representations ¡ and ¡algorithms ¡from ¡computer ¡science ¡and ¡ statistics. • Unless ¡we ¡adapt ¡computational ¡representations ¡ and ¡algorithms ¡to ¡that ¡new ¡context, ¡they ¡are ¡ unlikely ¡to ¡be ¡widely ¡adopted ¡and ¡used. • If ¡we ¡adapt, ¡radical ¡improvements ¡are ¡possible ¡ in ¡our ¡understanding ¡of ¡social ¡systems.

  13. Example

  14. (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  15. A B A B Early Sex Delinquency Early Sex Delinquency (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  16. Genetics and Family Environment C A B A B Early Sex Delinquency Early Sex Delinquency (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  17. What ¡is ¡causality? “The ¡paradigmatic ¡assertion ¡in ¡causal ¡relationships ¡ is ¡that ¡manipulation ¡of ¡a ¡cause ¡ will ¡result ¡in ¡the ¡manipulation ¡of ¡an ¡effect… ¡ Causation ¡implies ¡that ¡by ¡varying ¡one ¡factor, ¡ I ¡can ¡make ¡another ¡vary.” – ¡ Cook ¡& ¡Campbell ¡(1979)

  18. Causal ¡structures ¡producing ¡association Direct ¡causation ¡— ¡ A ¡causes ¡B ¡ in ¡the ¡ A B expected ¡direction. Reverse ¡causation ¡— ¡ A ¡causes ¡B ¡ in ¡the ¡ A B reverse ¡direction. Causal ¡chain ¡— ¡A ¡indirectly ¡causes ¡B ¡ A C B through ¡C. Common ¡cause ¡— ¡The ¡variable ¡ C ¡causes ¡ C both ¡ A ¡and ¡ B , ¡thus ¡inducing ¡a ¡dependence ¡ A B between ¡ A ¡and ¡ B . Conditioning ¡on ¡a ¡common ¡effect ¡— ¡ A ¡and ¡ B ¡ A B share ¡a ¡common ¡effect ¡ C , ¡and ¡conditioning ¡ on ¡this ¡variable ¡can ¡induce ¡a ¡dependence ¡ C between ¡ A ¡and ¡ B .

  19. Causal ¡structures ¡producing ¡association Direct ¡causation ¡— ¡ A ¡causes ¡B ¡ in ¡the ¡ Direct ¡causation ¡— ¡ A ¡causes ¡B ¡ in ¡the ¡ A B expected ¡direction. expected ¡direction. Reverse ¡causation ¡— ¡ A ¡causes ¡B ¡ in ¡the ¡ A B reverse ¡direction. Causal ¡chain ¡— ¡A ¡indirectly ¡causes ¡B ¡ A C B through ¡C. Common ¡cause ¡— ¡The ¡variable ¡ C ¡causes ¡ Common ¡cause ¡— ¡The ¡variable ¡ C ¡causes ¡ C both ¡ A ¡and ¡ B , ¡thus ¡inducing ¡a ¡dependence ¡ both ¡ A ¡and ¡ B , ¡thus ¡inducing ¡a ¡dependence ¡ A B between ¡ A ¡and ¡ B . between ¡ A ¡and ¡ B . Conditioning ¡on ¡a ¡common ¡effect ¡— ¡ A ¡and ¡ B ¡ A B share ¡a ¡common ¡effect ¡ C , ¡and ¡conditioning ¡ on ¡this ¡variable ¡can ¡induce ¡a ¡dependence ¡ C between ¡ A ¡and ¡ B .

  20. Modeling ... ... ... C 1 C 1 C 2 C 2 C 3 C 3 C n C n C 1 C 2 C 3 C n A A B B A B Early Sex Early Sex Delinquency Delinquency Early Sex Delinquency (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  21. Modeling • Armour ¡and ¡Haynie ¡modeled ¡a ¡large ¡number ¡ of ¡potential ¡influences ¡on ¡adolescent ¡behavior. • Even ¡after ¡accounting ¡for ¡these ¡potential ¡causes, ¡a ¡ statistical ¡association ¡remained ¡between ¡ early ¡sexual ¡activity ¡and ¡delinquency.

  22. Modeling ... ... C 1 C 2 C 3 C n C 1 C 2 C 3 C n A B A B Early Sex Delinquency Early Sex Delinquency (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  23. Control Modeling ... ... ... ... C 1 C 1 C 2 C 2 C 3 C 3 C n C n C 1 C 1 C 2 C 2 C 3 C 3 C n C n A A B B A A B B Early Sex Early Sex Delinquency Delinquency Early Sex Early Sex Delinquency Delinquency (Armour ¡& ¡Haynie ¡2007) (Harden ¡et ¡al. ¡2007)

  24. Twin ¡studies Genotype ... ... E F Z E F Z A C A C Phenotype D B D B Person ¡1 Person ¡2

  25. Twin ¡studies Genotype ... E F Z A C A C Phenotype D B D B Person ¡1 Person ¡2

  26. (Hardin ¡et ¡al. ¡2007)

  27. Quasi-­‑experimental ¡Designs • Quasi-­‑experimental ¡designs ¡(QEDs) ¡are ¡a ¡family ¡of ¡ methods ¡for ¡exploiting ¡fortuitous ¡situations ¡in ¡ observational ¡data ¡that ¡emulate ¡control ¡and ¡ randomization. • QEDs... • ... are ¡ templates ¡for ¡causal ¡inference... • ...that ¡increase ¡ statistical ¡power ... ¡ • ...by ¡exploiting ¡relations ¡and ¡time ... • ...to ¡reduce ¡or ¡eliminate ¡the ¡need ¡to ¡model ¡the ¡ effects ¡of ¡some ¡variables.

  28. Many ¡types ¡of ¡QEDs Within twin pairs • Twin ¡design ¡— ¡Control ¡the ¡value ¡of ¡some ¡ C potential ¡common ¡causes ¡ within ¡specified ¡pairs ¡of ¡instances. A B • Non-­‑equivalent ¡control ¡group ¡design ¡— ¡ C Compare ¡temporal ¡responses ¡of ¡treated ¡ instances ¡to ¡a ¡control ¡group ¡of ¡similar ¡ A B untreated ¡instances. • Regression ¡discontinuity ¡design ¡— ¡Identify ¡ C cases ¡where ¡treatment ¡is ¡assigned ¡based ¡ on ¡a ¡single ¡variable. A B • and ¡many ¡more... ¡

  29. Types ¡of ¡threats ¡to ¡validity • Statistical ¡conclusion ¡validity ¡ Is ¡there ¡a ¡statistical ¡dependence ¡between ¡ treatment ¡and ¡outcome? • Internal ¡validity ¡ Does ¡the ¡observed ¡correlation ¡reflect ¡a ¡causal ¡ dependence ¡between ¡treatment ¡and ¡outcome? • Construct ¡validity ¡ Do ¡the ¡sampling ¡particulars ¡correspond ¡to ¡the ¡ higher-­‑order ¡constructs ¡we ¡wish ¡to ¡examine? • External ¡validity ¡ Does ¡the ¡inferred ¡causal ¡relationship ¡generalize ¡to ¡ alternative ¡units, ¡treatment ¡variables, ¡and ¡outcome ¡ variables? Shadish, ¡Cook, ¡& ¡Campbell, ¡ Experimental ¡and ¡Quasi-­‑experimental ¡Designs ¡for ¡Generalized ¡Causal ¡Inference , ¡Houghton ¡Mifflin, ¡2002

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend