Building a Click Model From Idea to Implementation YiqunLIU - - PowerPoint PPT Presentation

building a click model from idea to implementation
SMART_READER_LITE
LIVE PREVIEW

Building a Click Model From Idea to Implementation YiqunLIU - - PowerPoint PPT Presentation

Building a Click Model From Idea to Implementation YiqunLIU Department of Computer Science and Technology Tsinghua University User Behavior & Search ch Result Ranking A


slide-1
SLIDE 1

Building ¡a ¡Click ¡Model From ¡Idea ¡to ¡Implementation

YiqunLIU Department of Computer Science and Technology Tsinghua University

slide-2
SLIDE 2
  • A ¡simple ¡solution: ¡user ¡click = ¡relevance ¡voting
  • Works ¡well ¡for ¡most ¡navigational ¡queries ¡(e.g. ¡SIGIR15)
  • Problem: ¡position ¡bias
  • Users ¡tend ¡to ¡click ¡more ¡on ¡higher-­‑ranked ¡results

User ¡ ¡Behavior ¡ ¡& ¡ ¡Search ch ¡ ¡Result ¡ ¡Ranking

Courtesy of http://hubdesignsmagazine.com/2011/03/27/its-good-to-be-on-the-first-page-of-google/

slide-3
SLIDE 3

Result ¡ ¡Examination: ¡ ¡Click ck ¡ ¡models

  • Examination ¡Hypothesis ¡(Richardson ¡et ¡al., ¡2007)
  • Estimating ¡examination ¡probabilities
  • Cascade ¡model: ¡
  • Dependent click ¡model ¡(DCM):
  • User ¡browsing model ¡(UBM):
  • Other ¡models: ¡DBN, ¡CCM, ¡TCM...
slide-4
SLIDE 4

Fr From ¡ ¡Idea ¡ ¡to ¡ ¡Implementation

  • Click ¡model ¡assumptions
  • Ideal ¡case ¡(homogeneous ¡results): ¡Position ¡is ¡the ¡only ¡

factor ¡that ¡affects ¡behavior

  • Problem: ¡results ¡have ¡different ¡presentation ¡styles
  • Ideal ¡case ¡(cascade ¡assumption): ¡Results ¡are ¡examined ¡

from ¡top ¡to ¡bottom

  • Problem: ¡results ¡are ¡often ¡skipped ¡or ¡revisited
slide-5
SLIDE 5

Research ch ¡ ¡Questions

  • Presentation ¡bias ¡problem: ¡

a ¡click ¡model ¡incorporating ¡vertical ¡results

  • Non-­‑sequential ¡examination ¡problem: ¡

a ¡click ¡model ¡incorporating ¡revisiting ¡behaviors

slide-6
SLIDE 6

Het Heter erogen geneo eous Search ch Re Results

  • Vertical results are everywhere (over 80% SERPs)

Encyclo- pedia Vertical

slide-7
SLIDE 7

Vertica cal-­‑

  • ­‑aware ¡

¡Click ck ¡ ¡Model

Rank ¡1st Rank ¡3rd Rank ¡5th

  • Attractiveness ¡Effect ¡(Wang ¡et ¡al., ¡2013; ¡Liu ¡et ¡al., ¡2015)
  • Certain ¡verticals ¡draw ¡much ¡attention ¡from ¡users
slide-8
SLIDE 8

Vertica cal-­‑

  • ­‑aware ¡

¡Click ck ¡ ¡Model

  • Cut-­‑off ¡Effect ¡(Liu ¡et ¡al., ¡2015)
  • After ¡users ¡have ¡viewed ¡on-­‑topic verticals, ¡they ¡are ¡

more ¡likely ¡to ¡decrease their visual attention on the

  • rganic results which are below verticals.

Relevant Vertical Textual Encyclo- pedia Image-only Application

  • download

News Organic Vertical 30.13% 16.70% 8.44% 13.04% 22.61% Diff

  • 12.95%
  • 51.74%*
  • 75.62%**
  • 62.32%**
  • 34.68%

Organic Vertical 26.30% 19.27% 10.33% 6.21% 38.69% Diff 4.09%

  • 23.76%
  • 59.10%*
  • 75.44%*

53.09% Position = 3 34.61% Position = 5 25.27%

slide-9
SLIDE 9

Vertica cal-­‑

  • ­‑aware ¡

¡Click ck ¡ ¡Model

  • Restart ¡effect (Wang ¡et ¡al., ¡2013)
  • Most ¡users ¡(70%) ¡will ¡restart ¡from ¡the ¡beginning ¡to ¡continue
slide-10
SLIDE 10

Vertica cal-­‑

  • ­‑aw

awar are ¡ ¡Click ck ¡ ¡Model ¡ ¡

  • Model ¡Construction ¡(based ¡on ¡UBM)

𝑄 𝐷# = 1 𝐹# = 0 = 0 𝑄 𝐷# = 1 𝐹# = 1 = 𝑄(𝐵# = 1|𝐹# = 1) 𝑄 𝐹# = 1 𝐺 = 0,𝐷.:#0. = 𝛿#,#023 𝑄 𝐵# = 1|𝐹# = 1,𝐺 = 0 = 𝛽5,# 𝑄 𝐺 = 1 = 𝜚78,28 𝑄 𝐹# = 1 𝐺 = 1,𝐷.:#0. = 𝛿#,#023 + 𝜄5,# 𝑄 𝐵# = 1|𝐹# = 1,𝐺 = 1 = 𝛽5,# + 𝛾5,# 𝑄 𝐶 = 1|𝐺 = 0 = 0 𝑄 𝐶 = 1|𝐺 = 1 = 𝜏78,28

Effect ¡on ¡Examination Effect ¡on ¡Click-­‑through Restart ¡effect Original ¡ UBM ¡ Users ¡examine ¡ vertical ¡results ¡at ¡first ¡ Simplified ¡ case: ¡difficult ¡to ¡quantify ¡the ¡ effect ¡when ¡not ¡all ¡results ¡are ¡affected

slide-11
SLIDE 11

Vertica cal-­‑

  • ­‑aware ¡

¡Click ck ¡ ¡Model ¡ ¡

  • Experimental ¡results
  • About ¡300,000 ¡queries ¡and ¡11,000,000 ¡sessions ¡

collected ¡from ¡a ¡major ¡Chinese ¡search ¡engine

Perplexity UBM VCM VCM ¡Improvement Text ¡vertical 1.2266 1.2139 +5.58% Multimedia ¡vertical 1.3735 1.3071 +17.78% Application ¡vertical 1.1908 1.1601 +16.09% UBM VCM VCM ¡Improvement Text ¡vertical

  • ­‑2.9093
  • ­‑2.7968

+11.90% Multimedia ¡vertical

  • ­‑4.1142
  • ­‑3.8638

+28.44% Application ¡vertical

  • ­‑2.2671
  • ­‑2.1427

+13.24% Click/skip ¡perplexity Log-­‑likelihood

slide-12
SLIDE 12

Possible ¡ ¡Future ¡ ¡Direct ctions

  • How ¡to ¡rank ¡items ¡within ¡vertical ¡blocks?
  • An ¡example ¡vertical ¡block ¡composed ¡of ¡an ¡image ¡and ¡

several ¡hyperlinks ¡(e.g. ¡news, ¡Q&A ¡portal ¡results, ¡etc. ¡)

  • Position ¡bias: ¡only ¡for ¡the ¡top ¡result
  • Attractiveness ¡effect: ¡not ¡so ¡significant

Title Image Item1 Item2-5

1 2 3

13.53% 9.74% 39.11% 9.08% 9.74% 10.73% 8.09% 0% 10% 20% 30% 40% 50% 60% 70% Title Image Item1 Item2 Item3 Item4 Item5

news

slide-13
SLIDE 13

Research ch ¡ ¡Questions

  • Presentation ¡bias ¡problem: ¡

a ¡click ¡model ¡incorporating ¡vertical ¡results

  • Non-­‑sequential ¡examination ¡problem: ¡

a ¡click ¡model ¡incorporating ¡revisiting ¡behaviors

slide-14
SLIDE 14

Sequential ¡ ¡order ¡ ¡of ¡ ¡Examination/Click cking

  • Sequential ¡examination ¡happens ¡a ¡lot
  • Cascade ¡assumption: ¡Users ¡tend ¡to ¡examine ¡results ¡

from ¡top ¡to ¡bottom ¡

  • Mean ¡time ¡of ¡arrival ¡v.s. ¡result ¡ranking ¡position

Joachims et.al, Eye-tracking analysis of user behavior in www search. SIGIR 2005

slide-15
SLIDE 15

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Revisiting ¡behavior ¡cannot ¡be ¡ignored
  • Chinese ¡search ¡engine ¡(Sogou): ¡27.9% sessions
  • Non-­‑Chinese ¡search ¡engine ¡(Yandex): ¡30.4% sessions

Danqing Xu, Yiqun Liu, et al. Incorporating Revisiting Behaviors into Click Models. WSDM 2012

slide-16
SLIDE 16

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Depth-­‑first ¡strategy ¡(cascade ¡assumption)
  • Users ¡examine ¡search ¡result ¡lists ¡from ¡top ¡to ¡bottom
  • Accepted ¡by ¡most ¡existing ¡click ¡models

1 2 3 4 5 6 7 8 1 2 3 6 2 S E 1 6 2

Examine (unobserved) Click (observed) Reorganize ¡data ¡with ¡ cascade ¡assumption

1 6 2

Problem#1: ¡not ¡the ¡true ¡last ¡click Problem#2: ¡sequential ¡information is ¡missing

slide-17
SLIDE 17

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Why ¡is ¡it ¡difficult ¡to ¡retain ¡sequential ¡information

1 5 2 1 2 3 4 5 S E 1 2 3 1 2 3 4 2 S E 1 2 3 2 S E 1 3 2 S E

Long Revisit Short Revisit Skip ¡and ¡revisit ¡

Cascade ¡assumption Retaining ¡Sequential ¡ Information

slide-18
SLIDE 18

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Any ¡rules ¡in ¡users’ ¡non-­‑sequential ¡examination?
  • How ¡often ¡do ¡users ¡change ¡the ¡direction ¡of ¡

examination ¡between ¡clicks?

1 2 1 2 3 1 2 1 2 3 4

click examine

slide-19
SLIDE 19

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Any ¡rules ¡in ¡users’ ¡non-­‑sequential ¡examination?
  • How ¡far ¡do ¡users’ ¡eye ¡gazes ¡jump ¡after ¡examining ¡the ¡

current ¡clicked ¡result?

click examine

1 2 1 2 3 1 2 1 2 3 4 5

slide-20
SLIDE 20

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Locally ¡Unidirectional ¡Examination
  • Users ¡tend ¡to ¡examine ¡search ¡results ¡in ¡a ¡single ¡

direction ¡without ¡changes ¡between ¡clicks

slide-21
SLIDE 21

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Non ¡First-­‑order ¡Examination
  • Users ¡may ¡skip ¡a ¡few ¡results ¡and ¡examine ¡a ¡result ¡at ¡

some ¡distance ¡away ¡from ¡the ¡current ¡one ¡after ¡clicks

slide-22
SLIDE 22

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Locally ¡Unidirectional ¡Examination ¡Assumption ¡
  • Between ¡adjacent ¡clicks, ¡user’s ¡examination ¡direction ¡is ¡

strictly consistent with click direction ¡(↑ ¡or ¡↓).

  • Compared ¡with position based models: ¡Allow non-­‑

sequential click/examination sequence

  • Compared ¡with click sequence based models: ¡Reduce

lots of examination sequences

  • Non ¡First-­‑order ¡Examination ¡Assumption
  • Skipped ¡results ¡may ¡not ¡be ¡examined: ¡Cascade ¡model ¡

and ¡DCM ¡do ¡not ¡work, ¡should ¡try ¡UBM

slide-23
SLIDE 23

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Partially ¡Sequential ¡Click ¡Model (PSCM)
slide-24
SLIDE 24

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Experimental ¡results: ¡Perplexity
  • Compared ¡with UBM (Sogou: +30.1%, Yandex: +27.4%)
  • Compared ¡with DBN (Sogou: +31.6%, Yandex: +27.9%)
slide-25
SLIDE 25

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Experimental ¡results: ¡relevance ¡estimation
  • Query-­‑URL Relevance Generated from Click Models
  • Annotated ¡by ¡Sogou’s professional ¡assessors
slide-26
SLIDE 26

No Non-­‑

  • ­‑se

sequential ¡ ¡Examination ¡ ¡Problem

  • Experimental ¡results: ¡user ¡preference ¡test
  • 200 ¡queries ¡and ¡22 ¡human ¡assessors
  • Which ¡ranking ¡lists ¡is ¡preferred ¡by ¡real ¡users
slide-27
SLIDE 27

Ta Take-­‑

  • ­‑Ho

Home ¡ e ¡Mes essages ges

  • Presentation ¡bias ¡problem: ¡

a ¡click ¡model ¡incorporating ¡vertical ¡results

  • Attractiveness effect; ¡Cut-­‑off ¡effect: ¡for ¡organic ¡results; ¡

Restart ¡effect: ¡different ¡examination ¡sequence

  • Non-­‑sequential ¡examination ¡problem: ¡

a ¡click ¡model ¡incorporating ¡revisiting ¡behaviors

  • Non-­‑sequential ¡examination ¡happens ¡a ¡lot ¡: ¡Locally ¡

unidirectional ¡and ¡non ¡First-­‑order ¡patterns

User ¡studies Assumptions Better ¡Click ¡ models

slide-28
SLIDE 28

Reference ce

  • (Presentation ¡bias ¡problem) ¡Chao ¡Wang, ¡Yiqun Liu, ¡Min ¡Zhang, ¡

Shaoping Ma, ¡MeihongZheng, ¡Jing ¡Qian, ¡Kuo Zhang. ¡Incorporating ¡ Vertical ¡Results ¡into ¡Search ¡Click ¡Models. ¡The ¡36th ¡ACM ¡SIGIR ¡ conference ¡(SIGIR ¡2013)

  • (Non-­‑sequential ¡examination ¡problem) Chao ¡Wang, ¡Yiqun Liu, ¡

Meng Wang, ¡Ke Zhou, ¡Jian-­‑Yun ¡Nie, ¡Shaoping Ma, ¡Incorporating ¡ Non-­‑sequential ¡Behavior ¡into ¡Click ¡Models. ¡The ¡38th ¡ACM ¡SIGIR ¡ conference ¡(SIGIR2015)

  • (Vertical ¡Examination ¡problem) Liu ¡Zeyang, ¡Yiqun Liu, ¡Ke Zhou, ¡

Min ¡Zhang, ¡Shaoping Ma, ¡Influence ¡of ¡Vertical ¡Result ¡in ¡Web ¡ Search ¡Examination. ¡The ¡38th ¡ACM ¡SIGIR ¡conference ¡(SIGIR2015) ¡

  • Codes ¡are ¡available ¡on ¡https://github.com/THUIR/PSCMModel
slide-29
SLIDE 29

Dataset is availablefor ¡academic ¡use: ¡

Eye ¡fixations, ¡mouse ¡movement ¡features, ¡ clicks, ¡relevance ¡annotation, ¡examination ¡ feedback, ¡…

http://www.thuir.cn/group/~YQLiu/

Thank you