Audi%ng Search Engines for Differen%al Sa%sfac%on across - - PowerPoint PPT Presentation

audi ng search engines for differen al sa sfac on across
SMART_READER_LITE
LIVE PREVIEW

Audi%ng Search Engines for Differen%al Sa%sfac%on across - - PowerPoint PPT Presentation

Audi%ng Search Engines for Differen%al Sa%sfac%on across Demographics Rishabh Mehrotra , Ashton Anderson, Fernando Diaz, Amit Sharma , Hanna Wallach, Emine Yilmaz


slide-1
SLIDE 1

Audi%ng ¡Search ¡Engines ¡for ¡ Differen%al ¡Sa%sfac%on ¡ across ¡Demographics ¡

Rishabh ¡Mehrotra, ¡Ashton ¡Anderson, ¡Fernando ¡Diaz, ¡ ¡ ¡Amit ¡Sharma, ¡Hanna ¡Wallach, ¡Emine ¡Yilmaz ¡

University ¡College ¡London ¡ Microso@ ¡Research ¡New ¡York ¡

slide-2
SLIDE 2

Fairness ¡across ¡demographics ¡

  • Online ¡services ¡-­‑ ¡adverGsed ¡as ¡being ¡

available ¡to ¡any ¡user ¡ ¡

  • Ethical ¡
  • Equal ¡access ¡to ¡everyone ¡

¡

  • PracGcal ¡
  • Equal ¡access ¡helps ¡aMract ¡a ¡large ¡and ¡

diverse ¡populaGon ¡of ¡users ¡

  • Service ¡providers ¡are ¡scruGnized ¡for ¡

seemingly ¡unfair ¡behavior ¡[1,2,3] ¡

  • Onus ¡on ¡us ¡
  • develop ¡fair ¡systems ¡

¡

[1] ¡N. ¡Diakopoulos. ¡Algorithmic ¡accountability. ¡Digital ¡Journalism, ¡3(3):398–415, ¡2015 ¡ [2] ¡S. ¡Barocas ¡and ¡A. ¡D. ¡Selbst. ¡Big ¡data’s ¡disparate ¡impact. ¡California ¡Law ¡Review, ¡104, ¡2016. ¡ [3] ¡C. ¡Munoz, ¡M. ¡Smith, ¡and ¡D. ¡Patel. ¡Big ¡data: ¡A ¡report ¡on ¡algorithmic ¡systems, ¡opportunity, ¡and ¡civil ¡rights. ¡Technical ¡report, ¡ExecuGve ¡Office ¡of ¡the ¡President ¡of ¡the ¡United ¡States, ¡May ¡2016. ¡

slide-3
SLIDE 3

Audi%ng ¡services ¡for ¡fairness ¡

We ¡offer ¡methods ¡for ¡audi%ng ¡a ¡ system’s ¡performance ¡for ¡detecGon ¡of ¡ differences ¡in ¡user ¡sa%sfac%on ¡across ¡ demographics ¡

slide-4
SLIDE 4

From ¡public ¡libraries ¡to ¡search ¡engines ¡

  • Modern ¡analogue ¡of ¡public ¡

libraries ¡

  • Dominant ¡role ¡in ¡informaGon ¡

access ¡

  • Fairness ¡in ¡performance! ¡
slide-5
SLIDE 5

Are ¡Search ¡Engines ¡Fair? ¡

slide-6
SLIDE 6

Search ¡Engines: ¡

  • Rely ¡on ¡ML ¡models ¡to ¡opGmize ¡for ¡user ¡sa%sfac%on ¡
  • Make ¡use ¡of ¡implicit ¡signals ¡
  • Metric ¡driven ¡development ¡

… ¡not ¡ ¡easy ¡to ¡audit ¡

From ¡public ¡libraries ¡to ¡search ¡engines ¡

slide-7
SLIDE 7

Tricky: ¡straigh.orward ¡op3miza3on ¡ can ¡lead ¡to ¡differen3al ¡performance

  • Search ¡engine ¡uses ¡a ¡standard ¡metric: ¡%me ¡spent ¡on ¡

clicked ¡result ¡page ¡as ¡an ¡indicator ¡of ¡saGsfacGon. ¡ ¡

  • Suppose ¡older ¡users ¡issue ¡more ¡of ¡“re$rement ¡

planning” ¡queries ¡

Age: ¡>50 ¡years ¡ 80% ¡users ¡ 10% ¡users ¡ Age: ¡<30 ¡years ¡

… ¡

Goal: ¡esGmate ¡difference ¡in ¡user ¡saGsfacGon ¡between ¡two ¡ demographic ¡groups. ¡

slide-8
SLIDE 8
  • 1. ¡Aggregate ¡Metrics ¡can ¡be ¡

misleading ¡

  • Overall ¡metrics ¡can ¡hide ¡differenGal ¡saGsfacGon ¡

¡

  • Average ¡user ¡sa%sfac%on ¡for ¡“re$rement ¡planning” ¡

may ¡be ¡high. ¡

¡ But, ¡ ¡

  • Average ¡saGsfacGon ¡for ¡younger ¡users=0.7 ¡
  • Average ¡saGsfacGon ¡for ¡older ¡users=0.2 ¡
slide-9
SLIDE 9
  • 2. ¡Query-­‑level ¡metrics ¡can ¡hide ¡

differen3al ¡sa3sfac3on

¡ ¡ <query-­‑X> ¡ <query-­‑X> ¡ <query-­‑X> ¡ <query-­‑X> ¡ <query-­‑X> ¡ <query-­‑X> ¡ reGrement ¡planning ¡ <query-­‑X> ¡ <query-­‑X> ¡ ¡ ¡ reGrement ¡planning ¡ reGrement ¡planning ¡ <query-­‑X> ¡ reGrement ¡planning ¡

… ¡

Assuming ¡same ¡user ¡saGsfacGon ¡for ¡

“re$rement ¡planning” ¡for ¡both ¡older ¡and ¡younger ¡ users ¡= ¡0.7 ¡ ¡ What ¡if ¡average ¡saGsfacGon ¡for ¡<query-­‑X> ¡= ¡0.9? ¡

(e.g. ¡<query-­‑X> ¡= ¡“facebook”) ¡

¡ Older ¡users ¡s%ll ¡receive ¡more ¡of ¡lower-­‑quality ¡ results ¡than ¡younger ¡users. ¡

¡ Younger ¡users ¡ Older ¡users ¡

slide-10
SLIDE 10
  • 3. ¡More ¡cri3cally, ¡even ¡individual-­‑

level ¡metrics ¡can ¡also ¡hide ¡differen3al ¡ sa3sfac3on ¡

Consider: ¡Reading ¡Gme ¡for ¡the ¡same ¡webpage ¡result ¡for ¡ the ¡same ¡user ¡saGsfacGon ¡

Time ¡spent ¡on ¡a ¡webpage ¡

Younger ¡Users ¡ Older ¡Users ¡

Metric ¡itself ¡could ¡be ¡confounded ¡with ¡demographics ¡

slide-11
SLIDE 11

We ¡must ¡control ¡for ¡natural ¡ demographic ¡varia3on ¡to ¡ meaningfully ¡audit ¡for ¡differen3al ¡

  • sa3sfac3on. ¡
slide-12
SLIDE 12

Outline ¡

1 Background ¡ 2 Data ¡& ¡metrics ¡ 3 Proposed ¡approaches: ¡

1 Context ¡Matching ¡ 2 Hierarchical ¡MulG-­‑level ¡model ¡

4 From ¡metrics ¡to ¡saGsfacGon ¡ 5 Discussion ¡

slide-13
SLIDE 13

Data: ¡Demographic ¡characteris%cs ¡ ¡

  • f ¡search ¡engine ¡users ¡
  • Internal ¡logs ¡from ¡Bing.com ¡for ¡two ¡weeks ¡
  • 4 ¡M ¡users ¡| ¡32 ¡M ¡impressions ¡| ¡17 ¡M ¡sessions ¡
  • Demographics: ¡Age ¡& ¡Gender ¡ ¡
  • Age: ¡
  • post-­‑Millenial: ¡ ¡<18 ¡
  • Millenial: ¡

¡18-­‑34 ¡

  • GeneraGon ¡X: ¡ ¡35-­‑54 ¡
  • Baby ¡Boomer: ¡ ¡55-­‑74 ¡

… ¡also ¡perform ¡external ¡audiGng ¡using ¡comScore ¡data ¡

slide-14
SLIDE 14

Metrics ¡Considered ¡

  • 1. Graded ¡UGlity ¡(GU) ¡
  • based ¡on ¡search ¡outcome ¡and ¡user ¡effort ¡
  • 2. Reformula%on ¡Rate ¡(RR) ¡
  • fracGon ¡of ¡queries ¡that ¡were ¡reformulated ¡
  • 3. Successful ¡Click ¡Count ¡(SCC) ¡
  • clicks ¡with ¡significant ¡dwell ¡Gmes ¡
  • 4. Page ¡Click ¡Counts ¡(PCC) ¡
  • total ¡no ¡of ¡clicks ¡on ¡SERP ¡
  • J. ¡Jiang, ¡A. ¡Hassan, ¡Z. ¡Shi, ¡and ¡R. ¡W. ¡White. ¡Understanding ¡and ¡predicGng ¡graded ¡search ¡saGsfacGon. ¡In ¡WSDM, ¡2015. ¡

Hassan, ¡X. ¡Shi, ¡N. ¡Craswell, ¡and ¡B. ¡Ramsey. ¡Beyond ¡clicks: ¡Query ¡reformulaGon ¡as ¡a ¡predictor ¡of ¡search ¡saGsfacGon. ¡In ¡CIKM, ¡2013. ¡

  • G. ¡Buscher, ¡L. ¡van ¡Elst, ¡and ¡A. ¡Dengel. ¡Segment-­‑level ¡Gme ¡as ¡implicit ¡feedback: ¡A ¡comparison ¡to ¡eye ¡tracking. ¡In ¡SIGIR, ¡2009. ¡
slide-15
SLIDE 15

Goal: ¡ esGmate ¡difference ¡in ¡user ¡saGsfacGon ¡

between ¡demographic ¡groups ¡ Obvious ¡solu%on: ¡ ¡ ¡ ¡demographic ¡binning! ¡

slide-16
SLIDE 16

Overall ¡metrics ¡across ¡Demographics ¡

GU PCC Reform SCC 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 1 2 3 4 1 2 3 4

Normalized metric value

GU PCC Reform SCC 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 female male female male

Age ¡ Gender ¡

  • SubstanGal ¡differences ¡in ¡performance ¡across ¡age ¡
  • Gender ¡– ¡not ¡so ¡much ¡

… ¡how ¡true ¡are ¡these? ¡

slide-17
SLIDE 17

PiSalls ¡with ¡Overall ¡Metrics ¡

Conflates ¡two ¡separate ¡effects: ¡

  • natural ¡demographic ¡varia%on ¡caused ¡by ¡the ¡differing ¡traits ¡

among ¡the ¡different ¡demographic ¡groups ¡e.g. ¡ ¡

  • Different ¡queries ¡issued ¡
  • Different ¡informaGon ¡need ¡for ¡the ¡same ¡query ¡
  • Even ¡for ¡the ¡same ¡saGsfacGon, ¡demographic ¡A ¡tends ¡to ¡click ¡more ¡

than ¡demographic ¡B ¡

  • Systemic ¡difference ¡in ¡user ¡saGsfacGon ¡due ¡to ¡the ¡search ¡

engine ¡ ¡ ¡ … ¡we ¡need ¡to ¡disentangle ¡them! ¡

slide-18
SLIDE 18

U3lize ¡work ¡from ¡causal ¡inference ¡

Demographics ¡ Metric ¡

slide-19
SLIDE 19

U3lize ¡work ¡from ¡causal ¡inference ¡

Demographics ¡ Metric ¡ User ¡ saGsfacGon ¡

slide-20
SLIDE 20

U3lize ¡work ¡from ¡causal ¡inference ¡

InformaGon ¡ Need ¡ Demographics ¡ Metric ¡ User ¡ saGsfacGon ¡ Query ¡ Search ¡ ¡ Results ¡

slide-21
SLIDE 21

U3lize ¡work ¡from ¡causal ¡inference ¡

InformaGon ¡ Need ¡ Demographics ¡ Metric ¡ User ¡ saGsfacGon ¡ Query ¡ Search ¡ ¡ Results ¡

slide-22
SLIDE 22

Outline ¡

1 MoGvaGon ¡ 2 Problems ¡with ¡naïve ¡audiGng ¡ 3 Data ¡& ¡Metrics ¡ 4 Proposed ¡approaches: ¡

1 Context ¡Matching ¡ 2 Hierarchical ¡MulG-­‑level ¡model ¡

5 From ¡metrics ¡to ¡saGsfacGon ¡ 6 Discussion ¡

slide-23
SLIDE 23

Proposed ¡Approaches ¡

Extremely ¡restric%ve ¡

More ¡robust ¡

1) ¡Context ¡Matching ¡

Generalizable ¡

Less ¡Robust ¡

2) ¡Mul%-­‑level ¡model ¡

slide-24
SLIDE 24

InformaGon ¡ Need ¡ Demographics ¡ Metric ¡ User ¡ saGsfacGon ¡ Query ¡ Search ¡ ¡ Results ¡ Context ¡ For ¡any ¡two ¡users ¡from ¡different ¡demographics, ¡

  • 1. Same ¡Query ¡
  • 2. Same ¡Informa%on ¡Need: ¡ ¡
  • 1. Control ¡for ¡user ¡intent: ¡same ¡final ¡SAT ¡click ¡
  • 2. Only ¡consider ¡navigaGonal ¡queries ¡
  • 3. Iden%cal ¡top-­‑8 ¡Search ¡Results ¡
  • I. ¡Con

Context ¡M ¡Match ching: ¡ ¡

selec3ng ¡for ¡ac3vity ¡with ¡near-­‑iden3cal ¡context

1.2 ¡M ¡impressions ¡ 19K ¡unique ¡queries ¡ 617K ¡users ¡

slide-25
SLIDE 25

Age-­‑wise ¡differences ¡in ¡metrics ¡disappear ¡

  • General ¡audiGng ¡tool: ¡robust ¡
  • Very ¡low ¡coverage ¡across ¡queries ¡
  • Did ¡we ¡control ¡for ¡too ¡much? ¡– ¡lose ¡over ¡60% ¡of ¡data! ¡

GU PCC Reform SCC 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 1 2 3 4 1 2 3 4

GU PCC Reform SCC 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 female male female male

slide-26
SLIDE 26

Proposed ¡Approaches ¡

Extremely ¡restric%ve ¡

More ¡robust ¡

1) ¡Context ¡Matching ¡

Generalizable ¡

Less ¡Robust ¡

2) ¡Mul%-­‑level ¡model ¡

slide-27
SLIDE 27

Query-­‑level ¡Mul%level ¡Model ¡

  • A ¡hierarchical ¡approach ¡that ¡treats ¡the ¡data ¡as ¡a ¡mixture ¡
  • f ¡distribuGons ¡based ¡on ¡demographics ¡and ¡queries ¡
  • Non-­‑nested ¡mulG-­‑level ¡model ¡
  • Users ¡& ¡Queries: ¡nested ¡within ¡non-­‑nested ¡age ¡and ¡gender ¡

groups ¡& ¡topics ¡

  • second ¡level ¡captures ¡variaGon ¡with ¡individual ¡query ¡properGes ¡
  • Age ¡effects ¡
  • Gender ¡effects ¡
  • Topic ¡effects ¡
  • <age, ¡gender, ¡topic> ¡

interacGon ¡effects ¡ Specific ¡example: ¡

slide-28
SLIDE 28

Age-­‑wise ¡differences ¡appear ¡again: ¡ bigger ¡differences ¡for ¡harder ¡queries ¡

Topic A Topic B Topic C

0.0 0.1 0.2 0.0 0.1 0.2 0.0 0.1 0.2

Query Difficulty Successful Click Count

Age

1 2 3 4 Topic A Topic B Topic C

0.8 0.9 1.0 0.8 0.9 1.0 0.8 0.9 1.0

Query Difficulty Successful Click Count

Age

1 2 3 4

slide-29
SLIDE 29

Outline ¡

1 MoGvaGon ¡ 2 Problems ¡with ¡naïve ¡audiGng ¡ 3 Data ¡& ¡Metrics ¡ 4 Proposed ¡approaches: ¡

1 Context ¡Matching ¡ 2 Hierarchical ¡MulG-­‑level ¡model ¡

5 From ¡metrics ¡to ¡sa%sfac%on ¡ 6 Discussion ¡

slide-30
SLIDE 30
  • EsGmaGng ¡absolute ¡saGsfacGon ¡is ¡

non-­‑trivial ¡

  • We ¡esGmate ¡relaGve ¡saGsfacGon ¡

by ¡considering ¡pairs ¡of ¡impressions ¡

  • ¡which ¡impression ¡led ¡to ¡a ¡higher ¡

saGsfacGon ¡ ¡

  • ¡Construct ¡a ¡conservaGve ¡“high-­‑

precision, ¡low-­‑recall” ¡proxy ¡for ¡ pairwise ¡saGsfacGon ¡

  • by ¡only ¡considering ¡“big” ¡differences ¡

in ¡observed ¡metric ¡for ¡the ¡same ¡ query ¡

From ¡Metric ¡to ¡Sa%sfac%on ¡

  • LogisGc ¡regression ¡model ¡for ¡esGmaGng ¡probability ¡of ¡

impression ¡i ¡being ¡more ¡saGsfied ¡than ¡impression ¡j: ¡

slide-31
SLIDE 31

Again, ¡see ¡a ¡small ¡age-­‑wise ¡difference ¡in ¡ sa%sfac%on ¡ ¡ ¡

0.52 0.52 0.47 0.44 0.5 0.51 0.45 0.44 0.54 0.55 0.5 0.5 0.56 0.56 0.5 0.5

4 3 2 1 1 2 3 4

Age j Age i

  • Older ¡users ¡are ¡slightly ¡more ¡saGsfied ¡than ¡younger ¡users ¡
slide-32
SLIDE 32
  • AudiGng ¡is ¡more ¡nuanced ¡than ¡merely ¡measuring ¡metrics ¡on ¡

demographically-­‑binned ¡traffic ¡

  • developed ¡techniques ¡to ¡audiGng ¡search ¡engines ¡
  • We ¡find ¡light ¡trend ¡towards ¡older ¡users ¡being ¡more ¡saGsfied. ¡
  • General ¡framework ¡for ¡internally ¡audiGng ¡systems ¡
  • Plug-­‑in ¡different ¡metrics ¡
  • Plug-­‑in ¡different ¡demographics/user ¡groups ¡

Future ¡Work ¡

Ø develop ¡metrics ¡which ¡are ¡not ¡confounded ¡with ¡demographics ¡ Ø InvesGgate ¡causes ¡of ¡metric ¡differences ¡

Ø Query ¡level ¡analysis ¡ Ø SERP ¡level ¡analysis ¡

Ø Dwell ¡Gme ¡thresholds ¡for ¡SAT ¡predicGon ¡based ¡on ¡demographic ¡ informaGon ¡

Discussion ¡

slide-33
SLIDE 33

Thank ¡You! ¡

Rishabh ¡Mehrotra ¡

PhD ¡candidate ¡@ ¡UCL ¡ hMp://www.rishabhmehrotra.com ¡ ¡ @erishabh ¡ r.mehrotra@cs.ucl.ac.uk ¡

AudiGng ¡is ¡more ¡nuanced ¡than ¡merely ¡measuring ¡metrics ¡on ¡demographically-­‑binned ¡

  • traffic. ¡

¡ General ¡framework ¡for ¡audiGng ¡systems ¡ Plug-­‑in ¡different ¡metrics ¡ Plug-­‑in ¡different ¡demographics/user ¡groups ¡ ¡

slide-34
SLIDE 34

Future ¡Work ¡

Query Demographics Metric Difference essenGal ¡oils ¡guide ¡ Female ¡Age ¡2 ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Male ¡Age ¡4 ¡ 4.5 ¡ make ¡your ¡own ¡game ¡ male3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡female3 ¡ 4.25 ¡ macbook ¡pro ¡vs ¡macbook ¡air ¡ Female2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male3 ¡ 3.9 ¡ ediGng ¡so@ware ¡for ¡youtube ¡videos ¡ Male2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male3 ¡ 3.833333333333333 ¡ emoGons ¡ Male2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4 ¡ 3.5 ¡ avaya ¡phone ¡manual ¡ Female3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4 ¡ 3.5 ¡ catholic ¡saints ¡ Male4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male3 ¡ 3.5 ¡ futures ¡market ¡ Male3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male5 ¡ 3.333333333333333 ¡ medal ¡of ¡honor ¡walkthrough ¡ps3 ¡ Male3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡female2 ¡ 3.2142857142857144 ¡ all ¡wheel ¡drive ¡cars ¡ Male4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡female4 ¡ 3 ¡ kob ¡tv ¡albuquerque ¡news ¡4 ¡ Female4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4-­‑min ¡ 3 ¡ foods ¡high ¡in ¡iron ¡ Female3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡female4 ¡ 3 ¡ 478-­‑288-­‑1122 ¡ Male3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4 ¡ 2.95 ¡ cheeseburger ¡dip ¡ Female4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4 ¡ 2.833333333333333 ¡ argosy ¡capital ¡ Male3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡vs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡male4-­‑min ¡ 2.5 ¡

slide-35
SLIDE 35

0.51 0.48 0.45 0.47 0.52 0.49 0.48 0.44 0.55 0.52 0.5 0.49 0.53 0.51 0.51 0.5

4 3 2 1 1 2 3 4

Age j Age i

  • Experiment ¡on ¡a ¡publicly ¡

available ¡dataset ¡

  • 2 ¡weeks ¡logs ¡of ¡comScore ¡data ¡
  • Use ¡PCC ¡metric ¡to ¡gauge ¡

saGsfacGon ¡

  • Probability ¡of ¡impression ¡i ¡being ¡ ¡

more ¡saGsfied ¡than ¡impression ¡j: ¡

External ¡Audi%ng ¡

slide-36
SLIDE 36

Future ¡Work ¡

slide-37
SLIDE 37

Demographic ¡distribu%on ¡of ¡user ¡ac%vity ¡ ¡

female male

fraction of users

0.0 0.1 0.2 0.3 0.4 0.5 female male

query frequency

0.0 0.1 0.2 0.3 0.4 0.5 1 2 3 4 0.0 0.1 0.2 0.3 0.4 1 2 3 4 0.0 0.1 0.2 0.3 0.4 0.5 head torso tail

Age ¡Groups ¡

slide-38
SLIDE 38

Characterizing ¡ ¡Demo mographics: ¡ ¡ Gen Gender er

0 ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡ female ¡

Avg ¡No ¡of ¡Sessions ¡Per ¡ User ¡

0 ¡ 1 ¡ 2 ¡ 3 ¡ female ¡

Avg ¡Session ¡Length ¡ (no ¡of ¡Impressions) ¡

0 ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡ female ¡

Avg ¡No ¡of ¡Words ¡Per ¡ Query ¡

0 ¡ 5 ¡ 10 ¡ 15 ¡ female ¡

Avg ¡No ¡of ¡Characters ¡ Per ¡Query ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ female ¡ male ¡

% ¡Head ¡Queries ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ female ¡ male ¡

% ¡Nav ¡Queries ¡

0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ female ¡ male ¡

% ¡Tail ¡Queries ¡

0 ¡ 5000000 ¡ 10000000 ¡ female ¡ male ¡

No ¡of ¡Users ¡

Male ¡ Female ¡

premier ¡league ¡ pinterest ¡ bbc ¡football ¡ hautelook ¡ watchespn ¡ weight ¡watchers ¡ pirate ¡bay ¡ sephora ¡

Some ¡highly ¡discriminaGng ¡queries ¡in ¡terms ¡of ¡P(D|Q): ¡

slide-39
SLIDE 39

0.51 0.48 0.45 0.47 0.52 0.49 0.48 0.44 0.55 0.52 0.5 0.49 0.53 0.51 0.51 0.5

4 3 2 1 1 2 3 4

Age j Age i

  • Experiment ¡on ¡a ¡publicly ¡available ¡dataset ¡
  • 2 ¡weeks ¡logs ¡of ¡comScore ¡data ¡
  • Use ¡PCC ¡metric ¡to ¡gauge ¡saGsfacGon ¡
  • Probability ¡of ¡impression ¡i ¡being ¡ ¡

more ¡saGsfied ¡than ¡impression ¡j: ¡

External ¡Audi%ng ¡

slide-40
SLIDE 40

Characterizing ¡ ¡Demo mographics: ¡ ¡Age

0 ¡ 2000000 ¡4000000 ¡6000000 ¡8000000 ¡ 1 ¡ 3 ¡ 5 ¡

No ¡of ¡Users ¡

0 ¡ 2 ¡ 4 ¡ 6 ¡ 1 ¡ 3 ¡ 5 ¡

Avg ¡No ¡of ¡Sessions ¡Per ¡ User ¡

0 ¡ 1 ¡ 2 ¡ 3 ¡ 1 ¡ 3 ¡ 5 ¡

Avg ¡Session ¡Length ¡ (no ¡of ¡Impressions) ¡

0 ¡ 2 ¡ 4 ¡ 6 ¡ 1 ¡ 3 ¡ 5 ¡

Avg ¡No ¡of ¡Words ¡Per ¡ Query ¡

0 ¡ 5 ¡ 10 ¡ 15 ¡ 20 ¡ 1 ¡ 4 ¡

Avg ¡No ¡of ¡ Characters ¡Per ¡ Query ¡

  • ­‑0.05 ¡

0.05 ¡ 0.15 ¡ 0.25 ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡ 5 ¡ 6 ¡

% ¡Head ¡Queries ¡

  • ­‑0.05 ¡

0.05 ¡ 0.15 ¡ 0.25 ¡ 0.35 ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡ 5 ¡ 6 ¡

% ¡Tail ¡Queries ¡

  • ­‑0.05 ¡

0.05 ¡ 0.15 ¡ 0.25 ¡ 0.35 ¡ 1 ¡ 2 ¡ 3 ¡ 4 ¡ 5 ¡ 6 ¡

% ¡Nav ¡Queries ¡

Age ¡<20 ¡ Age: ¡20-­‑30 ¡ Age: ¡30-­‑50 ¡ Age: ¡50-­‑70 ¡

periodic ¡table ¡ debt ¡ spellingcity ¡

  • urGme.com ¡daGng ¡

mathway ¡ daGng ¡ slickdeals ¡ hairstyles ¡women ¡over ¡ 50 ¡ graphing ¡calculator ¡ school ¡credit ¡ www.linkedin.com ¡ social ¡security ¡benefits ¡

Some ¡highly ¡discriminaGng ¡queries ¡in ¡terms ¡of ¡P(D| Q): ¡

slide-41
SLIDE 41
  • Young ¡user

¡, ¡Old ¡user ¡

  • Issue ¡same ¡query ¡
  • See ¡search ¡results ¡
  • How ¡saGsfied ¡are ¡you? ¡
slide-42
SLIDE 42

Query ¡level ¡Difficulty ¡

  • Xi: ¡Feature ¡corresponding ¡to ¡inherent ¡difficulty ¡of ¡query ¡
  • Typical ¡methods ¡(reformulaGons, ¡dwell ¡Gmes) ¡employ ¡

user ¡behavior ¡– ¡correlated ¡with ¡demographics ¡

  • Need ¡a ¡measure ¡unconfounded ¡with ¡demographics ¡
  • Method: ¡
  • Per ¡demographic ¡order ¡query ¡by ¡increasing ¡order ¡of ¡avg ¡GU ¡

score ¡

  • Compute ¡per ¡demographic ¡percenGle ¡of ¡the ¡query ¡(~query’s ¡

difficulty ¡in ¡each ¡demographic) ¡

  • Mean ¡of ¡percenGles ¡across ¡demographics ¡
slide-43
SLIDE 43