Pe Personalized Language Model fo for Query Auto- - - PowerPoint PPT Presentation

pe personalized language model fo for query auto co
SMART_READER_LITE
LIVE PREVIEW

Pe Personalized Language Model fo for Query Auto- - - PowerPoint PPT Presentation

Pe Personalized Language Model fo for Query Auto- -Co Completion Aaron Jaech and Mari Ostendorf University of Washington Qu Query Auto- -Co


slide-1
SLIDE 1

Pe Personalized ¡ ¡Language ¡ ¡Model ¡ ¡ fo for ¡ ¡Query ¡ ¡Auto-­‑

  • ­‑Co

Completion

Aaron ¡Jaech ¡and ¡Mari ¡Ostendorf University ¡of ¡Washington

slide-2
SLIDE 2

Qu Query ¡ ¡Auto-­‑

  • ­‑Co

Completion

  • Search ¡engine ¡suggests ¡queries ¡as ¡

the ¡user ¡types

  • Idea ¡from ¡Park ¡& ¡Chiba ¡(2017): ¡Use ¡

an ¡LSTM ¡to ¡generate ¡completions

Memory ¡savings ¡over ¡most ¡popular ¡ completion

Handles ¡previously ¡unseen ¡prefixes

  • Can ¡we ¡do ¡better ¡by ¡adapting ¡the ¡LM ¡

to ¡provide ¡personalized ¡suggestions?

2

slide-3
SLIDE 3

RN RNN ¡ ¡Language ¡ ¡Model ¡ ¡Adaptation

  • Learn ¡an ¡embedding, ¡c, ¡ ¡for ¡each ¡user ¡and ¡

use ¡it ¡to ¡adapt ¡the ¡predictions

  • Method ¡#1: Concatenate ¡the ¡user ¡

embedding ¡with ¡the ¡input ¡at ¡each ¡step*

Same ¡as ¡applying ¡a ¡constant ¡linear ¡shift ¡to ¡ the ¡bias ¡vector ¡(in ¡recurrent ¡& ¡output ¡layers)

Leaves ¡most ¡of ¡the ¡recurrent ¡model ¡ parameters ¡unchanged

  • Method ¡#2: Low-­‑rank ¡adaptation ¡of ¡

recurrent ¡weight ¡matrix ¡(FactorCell ¡model)

Concatenating ¡the ¡user ¡ embedding ¡is ¡the ¡same ¡ as ¡shifting ¡the ¡bias. ¡

3

𝑋 " = 𝑋 ¡𝑊 ℎ' = 𝜏 𝑋 " ℎ')*,𝑓', 𝑑 + 𝑐 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡= 𝜏 𝑋 ℎ')*, 𝑓' ¡ + 𝑊𝑑 + 𝑐

user ¡ embedding word ¡ embedding

Adjust ¡b ¡and ¡W! 𝑐0

* ¡Referred ¡to ¡here ¡as ¡ConcatCell (Mikolov& ¡Zweig, ¡2012)

slide-4
SLIDE 4

W0 + WA =

c L

L L

L

c

R

Low-­‑rank ¡adaptation Generic ¡weights Adapted ¡weights (e ¡+ ¡h) ¡x ¡h (e ¡+ ¡h) ¡x ¡h k ¡x ¡(e ¡+ ¡h) ¡x ¡r r ¡x ¡h ¡x ¡k 1 ¡x ¡k k ¡x ¡1

Fa FactorCell ¡ ¡Model

4

  • The ¡adaptation ¡matrix ¡is ¡formed ¡from ¡a ¡product ¡of ¡the ¡context ¡

embedding ¡with ¡left ¡and ¡right ¡bases.

  • The ¡two ¡bases ¡tensors ¡(L and ¡R) ¡hold ¡k ¡different ¡rank ¡r ¡matrices, ¡each ¡

the ¡same ¡size ¡as ¡W. Context ¡vectors ¡give ¡a ¡weighted ¡combination.

slide-5
SLIDE 5

Le Learning

  • User ¡embeddings, ¡recurrent ¡layer ¡weights ¡and ¡{L, ¡R} ¡tensor ¡learned ¡

jointly ¡

  • Need ¡online ¡learning ¡to ¡adapt ¡to ¡users ¡that ¡were ¡not ¡previously ¡seen
  • In ¡joint ¡training, ¡learn ¡a ¡cold-­‑start ¡embedding ¡for ¡set ¡of ¡infrequent ¡users
  • During ¡evaluation

Initialize ¡each ¡users’ ¡embedding ¡with ¡learned ¡cold-­‑start ¡vector

Make ¡query ¡suggestions

After ¡user ¡selects ¡a ¡query, ¡back-­‑propagate ¡and ¡only ¡update ¡the ¡user ¡embedding

5

slide-6
SLIDE 6

Dat Data ¡ a ¡& ¡ ¡Experim iments

  • Using ¡AOL ¡2006 ¡Query ¡Log ¡data, ¡173K ¡

users ¡and ¡12 ¡million ¡queries ¡for ¡training

  • User ¡embedding ¡size ¡= ¡32, ¡LSTM ¡size ¡= ¡600
  • Evaluate ¡on ¡500K ¡queries ¡with ¡disjoint ¡

user ¡population

  • Mean reciprocal ¡rank (MRR) ¡as ¡a ¡metric

6

slide-7
SLIDE 7

Ex Experimental ¡ ¡Re Results

7

Mean ¡Reciprocal ¡Rank

Performance ¡for ¡users ¡with ¡> ¡50 ¡queries

Benefit ¡improves ¡over ¡time!

slide-8
SLIDE 8

Qu Qualitative ¡ ¡Comparison

What ¡queries ¡are ¡boosted ¡the ¡most ¡after ¡searching ¡for ¡“high school softball” ¡and ¡“math homework help”?

8

FactorCell ConcatCell

high school musical

horoscope chris brown

high school musical

funnyjunk.com homes for sale funbrain.com modular homes chat room hair styles

Queries ¡that ¡most ¡decrease ¡in ¡likelihood ¡with ¡the ¡ FactorCell include ¡travel ¡agencies ¡and ¡plane ¡tickets. ¡

slide-9
SLIDE 9

Re Recent ¡ ¡Re Related ¡ ¡Work: ¡ ¡Fl

Florini & ¡ & ¡Lu, ¡ u, ¡NAACL ¡ ¡2018

  • Also ¡personalized ¡LSTM ¡for ¡query ¡prediction
  • ConcatCell adaptation ¡framework
  • User ¡embedding ¡learned ¡separately
  • No ¡online ¡learning
  • Assessed ¡on ¡two ¡datasets, ¡but ¡different ¡split ¡of ¡AOL ¡data
  • Confirms ¡benefit ¡of ¡adapted ¡LM

9

slide-10
SLIDE 10

Co Conclusions

  • Personalization ¡helps ¡and ¡the ¡benefit ¡increases ¡as ¡more ¡queries ¡are ¡seen
  • Stronger ¡adaptation ¡of ¡the ¡recurrent ¡layer ¡(FactorCell) ¡gives ¡better ¡

results ¡than ¡concatenating ¡a ¡user ¡vector

No ¡extra ¡latency/computation ¡due ¡to ¡caching ¡of ¡adapted ¡weight ¡matrix

  • Try ¡out ¡the ¡FactorCell ¡on ¡your ¡data

http://github.com/ajaech/query_completion

10

slide-11
SLIDE 11

THANKS!

slide-12
SLIDE 12

Qualitative ¡Comparison

What ¡queries ¡are ¡boosted ¡the ¡most ¡after ¡searching ¡for ¡“prada handbags” ¡and ¡“versace eyewear”?

12

FactorCell ConcatCell

neiman marcus

craigslist nyc pottery barn

myspace layours

jc penny verizon wireless verizon wireless jensen ackles bed bath and beyond webster dictionary

slide-13
SLIDE 13

Backup ¡Slides

13

slide-14
SLIDE 14

FactorCell ¡Model

14

W0 + WA =

Low-­‑rank ¡adaptation Generic ¡weights Adapted ¡weights

c L

L L

L

c

R

The ¡adapted ¡weight ¡ matrix ¡is ¡a ¡drop-­‑in ¡ replacement ¡for ¡W

h1 h2 h3 h4

<START> THE YELLOW FOX THE YELLOW FOX JUMPED

Much ¡larger ¡change ¡in ¡recurrent ¡ layer ¡than ¡what ¡ConcatCell does

ℎ'1* ¡ = ¡𝜏( W4 + W0 ℎ', 𝑓' + 𝑐)

slide-15
SLIDE 15

Prefix ¡and ¡query ¡length

  • Longer ¡queries ¡are ¡more ¡difficult
  • Suggestion ¡quality ¡improves ¡as ¡

prefix ¡length ¡increases

15