Predic'ng Responses to Microblog Posts Yoav Artzi 1 , - - PowerPoint PPT Presentation

predic ng responses to microblog posts
SMART_READER_LITE
LIVE PREVIEW

Predic'ng Responses to Microblog Posts Yoav Artzi 1 , - - PowerPoint PPT Presentation

Predic'ng Responses to Microblog Posts Yoav Artzi 1 , Patrick Pantel 2 and Michael Gamon 2 1 University of Washington, MicrosoC Research Work conducted at


slide-1
SLIDE 1

Predic'ng ¡Responses ¡to ¡ Microblog ¡Posts ¡

Yoav ¡Artzi1, ¡Patrick ¡Pantel2 ¡and ¡Michael ¡Gamon2 ¡

¡

1University ¡of ¡Washington, ¡MicrosoC ¡Research ¡

¡

Work ¡conducted ¡at ¡MicrosoC ¡Research ¡

¡

slide-2
SLIDE 2

Twee'ng ¡on ¡TwiGer ¡

A ¡tweet ¡is ¡140 ¡characters ¡long ¡ TwiGer ¡is ¡a ¡ social ¡network ¡ news ¡agency ¡ Users ¡respond ¡by ¡ replying ¡ retwee'ng ¡

slide-3
SLIDE 3

The ¡Problem ¡

  • Given ¡a ¡tweet ¡
slide-4
SLIDE 4

The ¡Problem ¡

  • Given ¡a ¡tweet ¡
  • Predict ¡response ¡

– Reply ¡ – Retweet ¡ Retweet ¡ Reply ¡

slide-5
SLIDE 5
slide-6
SLIDE 6
slide-7
SLIDE 7

Retweeted ¡ No ¡Response ¡

slide-8
SLIDE 8

Mo'va'on ¡

  • Good ¡indica'on ¡of ¡impact ¡
  • Increases ¡impact ¡
  • So ¡who ¡might ¡care ¡about ¡this? ¡

– Adver'sers ¡ – Celebri'es ¡ – Media ¡organiza'ons ¡

  • Also, ¡a ¡way ¡to ¡rank ¡tweets ¡
slide-9
SLIDE 9

Goal ¡

  • What ¡triggers ¡a ¡response? ¡
  • What ¡features ¡are ¡good ¡for ¡predic'on? ¡
  • Empirical ¡explora'on ¡
slide-10
SLIDE 10

Our ¡Approach: ¡Learning ¡

Extract ¡ Features ¡ Learner ¡ Social ¡ Network ¡ Tweets ¡ + ¡ Response ¡ Model ¡

Boosted ¡Decision ¡Trees ¡ Maximum ¡Entropy* ¡

*MaxEnt ¡by ¡Chris ¡Quirk, ¡Boosted ¡Decision ¡Trees ¡by ¡Qiang ¡Wu ¡ ¡

slide-11
SLIDE 11

Our ¡Approach: ¡Tes'ng ¡

Model ¡ Social ¡ Network ¡ Tweet ¡ Predic7on ¡

slide-12
SLIDE 12

Experimental ¡Setup ¡

  • One ¡week ¡of ¡TwiGer ¡data ¡
  • Searched ¡for ¡response ¡over ¡two ¡weeks ¡
  • Randomly ¡sampled ¡training ¡and ¡tes'ng ¡sets: ¡

– 750K ¡tweets ¡for ¡training ¡ – 188K ¡tweets ¡for ¡tes'ng ¡

slide-13
SLIDE 13

Results ¡

0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Precision ¡ Recall ¡ Boosted ¡ Decision ¡ Trees ¡ MaxEnt ¡

slide-14
SLIDE 14

Results ¡

Hard ¡to ¡predict ¡response, ¡for ¡most ¡tweet, ¡but ¡… ¡

0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Precision ¡ Recall ¡ Boosted ¡ Decision ¡ Trees ¡ MaxEnt ¡

slide-15
SLIDE 15

Results ¡

Hard ¡to ¡predict ¡response, ¡for ¡most ¡tweet, ¡but ¡there ¡ exists ¡a ¡large ¡set ¡for ¡which ¡we ¡can ¡predict ¡accurately ¡

0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Precision ¡ Recall ¡ Boosted ¡ Decision ¡ Trees ¡ MaxEnt ¡

slide-16
SLIDE 16

Results ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡

slide-17
SLIDE 17

Building ¡the ¡Model ¡

  • What ¡can ¡we ¡get ¡form ¡the ¡language ¡of ¡the ¡

tweet? ¡

  • Can ¡we ¡use ¡the ¡social ¡network ¡for ¡predic'on? ¡
slide-18
SLIDE 18

Features: ¡Sen'ment ¡

  • How ¡the ¡sen'ment ¡of ¡a ¡tweet ¡influences ¡the ¡

response ¡behavior? ¡

  • Count ¡of ¡nega've/posi've ¡sen'ment ¡words* ¡

+1 +1 +1 +1

*Sen'ment ¡lexicon ¡provided ¡by ¡Livia ¡Polanyi ¡

slide-19
SLIDE 19

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ sen'ment ¡

slide-20
SLIDE 20

Features: ¡Pos'ng ¡

  • Tweeter ¡pos'ng ¡trends ¡are ¡influenced ¡by ¡'me ¡

and ¡day ¡of ¡the ¡week ¡

  • Does ¡it ¡influence ¡response ¡behavior? ¡
  • Included ¡features: ¡

– Local ¡'me ¡of ¡pos'ng ¡ – Day ¡of ¡the ¡week ¡

slide-21
SLIDE 21

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ +pos'ng ¡ sen'ment ¡

slide-22
SLIDE 22

Features: ¡Content ¡

  • 45 ¡simple ¡features ¡over ¡the ¡content ¡of ¡the ¡tweet ¡
  • Manually ¡developed ¡by ¡observing ¡large ¡number ¡
  • f ¡tweets ¡

¡

# ¡stop ¡words ¡ # ¡user ¡references ¡ # ¡hash ¡tags ¡ % ¡non ¡English* ¡ # ¡tokens ¡ … ¡ ¡

*English ¡lexicon ¡provided ¡by ¡Lucy ¡Vanderwend ¡

slide-23
SLIDE 23

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ +content ¡ +pos'ng ¡ sen'ment ¡

slide-24
SLIDE 24

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

  • Detect ¡lexical ¡items ¡indica'ng ¡towards ¡certain ¡

response ¡behavior ¡

– 14M ¡bigrams ¡ – 400K ¡hashtags ¡ – Collected ¡from ¡186M ¡tweets ¡

  • Use ¡as ¡flags ¡on ¡each ¡tweet ¡that ¡has ¡them ¡
  • Issues: ¡

– Scalability ¡of ¡learning ¡ – Sparsity ¡

slide-25
SLIDE 25

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

  • Detect ¡lexical ¡items ¡indica'ng ¡towards ¡certain ¡

response ¡behavior ¡

– 14M ¡bigrams ¡ – 400K ¡hashtags ¡ – Collected ¡from ¡186M ¡tweets ¡

  • Use ¡as ¡flags ¡on ¡each ¡tweet ¡that ¡has ¡them ¡
  • Issues: ¡

– Scalability ¡of ¡learning ¡ – Sparsity ¡

slide-26
SLIDE 26

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

Collapsing ¡

  • For ¡every ¡lexical ¡item ¡l: ¡
  • Define ¡each ¡such ¡n ¡as ¡a ¡feature ¡
  • Trigger ¡feature ¡n ¡for ¡each ¡sample ¡that ¡

contains ¡l

tweets ¡containing ¡l ¡that ¡ received ¡no ¡response ¡ tweets ¡containing ¡l ¡that ¡ received ¡a ¡response ¡

slide-27
SLIDE 27

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

Collapsing ¡

  • For ¡every ¡lexical ¡item ¡l: ¡
  • Define ¡each ¡such ¡n ¡as ¡a ¡feature ¡
  • Trigger ¡feature ¡n ¡for ¡each ¡sample ¡that ¡

contains ¡l

tweets ¡containing ¡l ¡that ¡ received ¡no ¡response ¡ tweets ¡containing ¡l ¡that ¡ received ¡a ¡response ¡

slide-28
SLIDE 28

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

Collapsing ¡

  • For ¡every ¡lexical ¡item ¡l: ¡
  • Define ¡each ¡such ¡n ¡as ¡a ¡feature ¡
  • Trigger ¡feature ¡n ¡for ¡each ¡sample ¡that ¡

contains ¡l

n

tweets ¡containing ¡l ¡that ¡ received ¡no ¡response ¡ tweets ¡containing ¡l ¡that ¡ received ¡a ¡response ¡

slide-29
SLIDE 29

Features: ¡Lexical ¡Ra'o ¡Buckets ¡

Collapsing ¡

  • For ¡every ¡lexical ¡item ¡l: ¡
  • Define ¡each ¡such ¡n ¡as ¡a ¡feature ¡
  • Trigger ¡feature ¡n ¡for ¡each ¡sample ¡that ¡

contains ¡l

tweets ¡containing ¡l ¡that ¡ received ¡no ¡response ¡ tweets ¡containing ¡l ¡that ¡ received ¡a ¡response ¡

n

slide-30
SLIDE 30

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ +lexical ¡ +content ¡ +pos'ng ¡ sen'ment ¡

slide-31
SLIDE 31

Features: ¡Social ¡

  • What ¡are ¡the ¡characteris'cs ¡of ¡the ¡user’s ¡

network? ¡

  • Simple ¡social ¡sta's'cs ¡

– Number ¡of ¡followers ¡ – Number ¡of ¡followings ¡

slide-32
SLIDE 32

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ +socialNet ¡ +lexical ¡ +content ¡ +pos'ng ¡ sen'ment ¡

slide-33
SLIDE 33

Features: ¡User ¡History ¡

  • Aggregate ¡historical ¡

response ¡to ¡user ¡

  • 3 ¡months ¡of ¡TwiGer ¡data ¡

– Over ¡2 ¡billion ¡tweets ¡

  • Compute ¡sta's'cs ¡

– For ¡example: ¡ra'o ¡of ¡tweets ¡ retweeted ¡

slide-34
SLIDE 34

Building ¡the ¡Model ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Precision ¡ Recall ¡ +history ¡ +socialNet ¡ +lexical ¡ +content ¡ +pos'ng ¡ sen'ment ¡

slide-35
SLIDE 35

No ¡Local ¡Content ¡Features ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.05 ¡ 0.1 ¡ 0.15 ¡ 0.2 ¡ Precision ¡ Recall ¡

All ¡features ¡ No ¡local ¡content ¡features ¡

slide-36
SLIDE 36

No ¡Aggregate ¡Features ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ 0.7 ¡ 0.8 ¡ 0.9 ¡ 1 ¡ 0 ¡ 0.05 ¡ 0.1 ¡ 0.15 ¡ 0.2 ¡ Precision ¡ Recall ¡

All ¡features ¡ No ¡aggregate ¡features ¡

slide-37
SLIDE 37

Examples ¡

Response ¡ Response ¡

slide-38
SLIDE 38

Examples ¡

Response ¡ Response ¡

slide-39
SLIDE 39

Examples ¡

slide-40
SLIDE 40

Examples ¡

Response ¡ Response ¡

slide-41
SLIDE 41

Examples ¡

Response ¡ Response ¡

slide-42
SLIDE 42

Conclusions ¡

  • Local ¡content ¡maGers ¡less ¡

– Or ¡harder ¡to ¡capture ¡

  • Despite ¡chronological ¡trends ¡on ¡TwiGer, ¡

pos'ng ¡'me ¡maGers ¡less ¡

  • Historical ¡behavior ¡is ¡a ¡good ¡indicator ¡
  • TwiGer ¡is ¡largely ¡a ¡social ¡game ¡
  • People ¡are ¡sensi've ¡to ¡certain ¡phrases ¡
slide-43
SLIDE 43

Future ¡Work ¡

  • New ¡features, ¡such ¡as: ¡

– Clique ¡specific ¡language ¡features ¡ – Denseness ¡of ¡user’s ¡social ¡network ¡ – Men'ons ¡of ¡named ¡en''es ¡ – Tweet ¡topic ¡

  • Predic'ng ¡more: ¡

– Dis'nguishing ¡between ¡replies ¡and ¡retweets ¡ – Numerical ¡predic'ons ¡ – Predic'ng ¡length ¡of ¡conversa'on ¡thread ¡

slide-44
SLIDE 44

Thank ¡you ¡for ¡listening ¡

@yoavartzi ¡

slide-45
SLIDE 45

[fin] ¡