predic ng responses to microblog posts
play

Predic'ng Responses to Microblog Posts Yoav Artzi 1 , - PowerPoint PPT Presentation

Predic'ng Responses to Microblog Posts Yoav Artzi 1 , Patrick Pantel 2 and Michael Gamon 2 1 University of Washington, MicrosoC Research Work conducted at


  1. Predic'ng ¡Responses ¡to ¡ Microblog ¡Posts ¡ Yoav ¡Artzi 1 , ¡Patrick ¡Pantel 2 ¡and ¡Michael ¡Gamon 2 ¡ ¡ 1 University ¡of ¡Washington, ¡MicrosoC ¡Research ¡ ¡ Work ¡conducted ¡at ¡MicrosoC ¡Research ¡ ¡

  2. Twee'ng ¡on ¡TwiGer ¡ A ¡tweet ¡is ¡140 ¡characters ¡long ¡ social ¡network ¡ TwiGer ¡is ¡a ¡ news ¡agency ¡ replying ¡ Users ¡respond ¡by ¡ retwee'ng ¡

  3. The ¡Problem ¡ • Given ¡a ¡tweet ¡

  4. The ¡Problem ¡ • Given ¡a ¡tweet ¡ • Predict ¡response ¡ – Reply ¡ – Retweet ¡ Retweet ¡ Reply ¡

  5. No ¡Response ¡ Retweeted ¡

  6. Mo'va'on ¡ • Good ¡indica'on ¡of ¡impact ¡ • Increases ¡impact ¡ • So ¡who ¡might ¡care ¡about ¡this? ¡ – Adver'sers ¡ – Celebri'es ¡ – Media ¡organiza'ons ¡ • Also, ¡a ¡way ¡to ¡rank ¡tweets ¡

  7. Goal ¡ • What ¡triggers ¡a ¡response? ¡ • What ¡features ¡are ¡good ¡for ¡predic'on? ¡ • Empirical ¡explora'on ¡

  8. Our ¡Approach: ¡Learning ¡ Social ¡ Network ¡ Tweets ¡ Extract ¡ + ¡ Model ¡ Learner ¡ Features ¡ Response ¡ Boosted ¡Decision ¡Trees ¡ Maximum ¡Entropy* ¡ *MaxEnt ¡by ¡Chris ¡Quirk, ¡Boosted ¡Decision ¡Trees ¡by ¡Qiang ¡Wu ¡ ¡

  9. Our ¡Approach: ¡Tes'ng ¡ Social ¡ Network ¡ Tweet ¡ Model ¡ Predic7on ¡

  10. Experimental ¡Setup ¡ • One ¡week ¡of ¡TwiGer ¡data ¡ • Searched ¡for ¡response ¡over ¡two ¡weeks ¡ • Randomly ¡sampled ¡training ¡and ¡tes'ng ¡sets: ¡ – 750K ¡tweets ¡for ¡training ¡ – 188K ¡tweets ¡for ¡tes'ng ¡

  11. Results ¡ 1 ¡ Boosted ¡ 0.8 ¡ Decision ¡ Precision ¡ 0.6 ¡ Trees ¡ MaxEnt ¡ 0.4 ¡ 0.2 ¡ 0 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Recall ¡

  12. Results ¡ 1 ¡ Boosted ¡ 0.8 ¡ Decision ¡ Precision ¡ 0.6 ¡ Trees ¡ MaxEnt ¡ 0.4 ¡ 0.2 ¡ 0 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Recall ¡ Hard ¡to ¡predict ¡response, ¡for ¡most ¡tweet, ¡but ¡… ¡

  13. Results ¡ 1 ¡ Boosted ¡ 0.8 ¡ Decision ¡ Precision ¡ 0.6 ¡ Trees ¡ MaxEnt ¡ 0.4 ¡ 0.2 ¡ 0 ¡ 0 ¡ 0.2 ¡ 0.4 ¡ 0.6 ¡ 0.8 ¡ 1 ¡ Recall ¡ Hard ¡to ¡predict ¡response, ¡for ¡most ¡tweet, ¡but ¡there ¡ exists ¡a ¡large ¡set ¡for ¡which ¡we ¡can ¡predict ¡accurately ¡

  14. Results ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ Precision ¡ 0.5 ¡ 0.4 ¡ 0.3 ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  15. Building ¡the ¡Model ¡ • What ¡can ¡we ¡get ¡form ¡the ¡language ¡of ¡the ¡ tweet? ¡ • Can ¡we ¡use ¡the ¡social ¡network ¡for ¡predic'on? ¡

  16. Features: ¡Sen'ment ¡ • How ¡the ¡sen'ment ¡of ¡a ¡tweet ¡influences ¡the ¡ response ¡behavior? ¡ • Count ¡of ¡nega've/posi've ¡sen'ment ¡words* ¡ +1 +1 +1 +1 *Sen'ment ¡lexicon ¡provided ¡by ¡Livia ¡Polanyi ¡

  17. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ Precision ¡ 0.5 ¡ sen'ment ¡ 0.4 ¡ 0.3 ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  18. Features: ¡Pos'ng ¡ • Tweeter ¡pos'ng ¡trends ¡are ¡influenced ¡by ¡'me ¡ and ¡day ¡of ¡the ¡week ¡ • Does ¡it ¡influence ¡response ¡behavior? ¡ • Included ¡features: ¡ – Local ¡'me ¡of ¡pos'ng ¡ – Day ¡of ¡the ¡week ¡

  19. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ Precision ¡ 0.5 ¡ +pos'ng ¡ 0.4 ¡ sen'ment ¡ 0.3 ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  20. Features: ¡Content ¡ • 45 ¡simple ¡features ¡over ¡the ¡content ¡of ¡the ¡tweet ¡ • Manually ¡developed ¡by ¡observing ¡large ¡number ¡ of ¡tweets ¡ ¡ # ¡stop ¡words ¡ # ¡user ¡references ¡ # ¡hash ¡tags ¡ % ¡non ¡English* ¡ # ¡tokens ¡ … ¡ ¡ *English ¡lexicon ¡provided ¡by ¡Lucy ¡Vanderwend ¡

  21. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ Precision ¡ +content ¡ 0.5 ¡ +pos'ng ¡ 0.4 ¡ sen'ment ¡ 0.3 ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  22. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ • Detect ¡lexical ¡items ¡indica'ng ¡towards ¡certain ¡ response ¡behavior ¡ – 14M ¡bigrams ¡ – 400K ¡hashtags ¡ – Collected ¡from ¡186M ¡tweets ¡ • Use ¡as ¡flags ¡on ¡each ¡tweet ¡that ¡has ¡them ¡ • Issues: ¡ – Scalability ¡of ¡learning ¡ – Sparsity ¡

  23. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ • Detect ¡lexical ¡items ¡indica'ng ¡towards ¡certain ¡ response ¡behavior ¡ – 14M ¡bigrams ¡ – 400K ¡hashtags ¡ – Collected ¡from ¡186M ¡tweets ¡ • Use ¡as ¡flags ¡on ¡each ¡tweet ¡that ¡has ¡them ¡ • Issues: ¡ – Scalability ¡of ¡learning ¡ – Sparsity ¡

  24. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ Collapsing ¡ • For ¡every ¡lexical ¡item ¡ l : ¡ tweets ¡containing ¡ l ¡that ¡ received ¡ no ¡response ¡ tweets ¡containing ¡ l ¡that ¡ received ¡a ¡response ¡ • Define ¡each ¡such ¡ n ¡as ¡a ¡feature ¡ • Trigger ¡feature ¡ n ¡for ¡each ¡sample ¡that ¡ contains ¡ l

  25. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ Collapsing ¡ • For ¡every ¡lexical ¡item ¡ l : ¡ tweets ¡containing ¡ l ¡that ¡ received ¡ no ¡response ¡ tweets ¡containing ¡ l ¡that ¡ received ¡a ¡response ¡ • Define ¡each ¡such ¡ n ¡as ¡a ¡feature ¡ • Trigger ¡feature ¡ n ¡for ¡each ¡sample ¡that ¡ contains ¡ l

  26. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ Collapsing ¡ • For ¡every ¡lexical ¡item ¡ l : ¡ tweets ¡containing ¡ l ¡that ¡ received ¡ no ¡response ¡ n tweets ¡containing ¡ l ¡that ¡ received ¡a ¡response ¡ • Define ¡each ¡such ¡ n ¡as ¡a ¡feature ¡ • Trigger ¡feature ¡ n ¡for ¡each ¡sample ¡that ¡ contains ¡ l

  27. Features: ¡Lexical ¡Ra'o ¡Buckets ¡ Collapsing ¡ • For ¡every ¡lexical ¡item ¡ l : ¡ tweets ¡containing ¡ l ¡that ¡ received ¡ no ¡response ¡ n tweets ¡containing ¡ l ¡that ¡ received ¡a ¡response ¡ • Define ¡each ¡such ¡ n ¡as ¡a ¡feature ¡ • Trigger ¡feature ¡ n ¡for ¡each ¡sample ¡that ¡ contains ¡ l

  28. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ Precision ¡ +lexical ¡ 0.5 ¡ +content ¡ 0.4 ¡ +pos'ng ¡ 0.3 ¡ sen'ment ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  29. Features: ¡Social ¡ • What ¡are ¡the ¡characteris'cs ¡of ¡the ¡user’s ¡ network? ¡ • Simple ¡social ¡sta's'cs ¡ – Number ¡of ¡followers ¡ – Number ¡of ¡followings ¡

  30. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ 0.6 ¡ +socialNet ¡ Precision ¡ +lexical ¡ 0.5 ¡ +content ¡ 0.4 ¡ +pos'ng ¡ 0.3 ¡ sen'ment ¡ 0.2 ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

  31. Features: ¡User ¡History ¡ • Aggregate ¡historical ¡ response ¡to ¡user ¡ • 3 ¡months ¡of ¡TwiGer ¡data ¡ – Over ¡2 ¡billion ¡tweets ¡ • Compute ¡sta's'cs ¡ – For ¡example: ¡ra'o ¡of ¡tweets ¡ retweeted ¡

  32. Building ¡the ¡Model ¡ 1 ¡ 0.9 ¡ 0.8 ¡ 0.7 ¡ +history ¡ 0.6 ¡ Precision ¡ +socialNet ¡ 0.5 ¡ +lexical ¡ 0.4 ¡ +content ¡ 0.3 ¡ +pos'ng ¡ 0.2 ¡ sen'ment ¡ 0.1 ¡ 0 ¡ 0 ¡ 0.02 ¡ 0.04 ¡ 0.06 ¡ 0.08 ¡ 0.1 ¡ 0.12 ¡ 0.14 ¡ 0.16 ¡ 0.18 ¡ 0.2 ¡ Recall ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend