effec ve structured query formula on for session search
play

Effec)ve Structured Query Formula)on for Session Search - PDF document

11/12/12 Effec)ve Structured Query Formula)on for Session Search Dongyi Guan, Grace Hui Yang, Nazli Goharian Speaker: Grace Hui Yang Department of


  1. 11/12/12 ¡ Effec)ve ¡Structured ¡Query ¡ Formula)on ¡for ¡Session ¡Search ¡ Dongyi ¡Guan, ¡Grace ¡Hui ¡Yang, ¡Nazli ¡Goharian ¡ ¡ Speaker: ¡Grace ¡Hui ¡Yang ¡ ¡ Department ¡of ¡Computer ¡Science ¡ Georgetown ¡University ¡ ¡ Nov ¡9, ¡2012@TREC ¡ ¡ 1 ¡ Introduc)on ¡ • A ¡session ¡contains ¡ ¡ ¡ • Interac)ons ¡ -­‑ Previous ¡Queries ¡ ¡ q 1 , ¡ q 2 , ¡… ¡, ¡ q n -1 ¡ -­‑ Previous ¡Search ¡Results ¡ -­‑ Click ¡Informa)on ¡ • Current ¡Query ¡ q n ¡ • A ¡ retrieval ¡task ¡ ¡ • So, ¡we ¡basically ¡use ¡Lemur ¡– ¡a ¡strong ¡ baseline ¡ • The ¡problem ¡becomes ¡ ¡ • how ¡to ¡make ¡good ¡use ¡of ¡Lemur ¡ ¡ • … ¡and ¡how ¡to ¡improve ¡over ¡Lemur ¡ 2 ¡ 1 ¡

  2. 11/12/12 ¡ Outline ¡ • Our ¡Approach ¡ – Structured ¡Query ¡Formula)on ¡ – Query ¡Expansion ¡ – Duplicated ¡Queries ¡ – Document ¡Re-­‑ranking ¡by ¡Dwell ¡Time ¡ • Experiments ¡ 3 ¡ Structured ¡Query ¡Formula)on ¡ • We ¡emphasize ¡on ¡formula=ng ¡effec=ve ¡Lemur ¡queries ¡ – then ¡submit ¡the ¡queries ¡to ¡Lemur ¡ • An ¡observa)on: ¡ – In ¡a ¡query, ¡several ¡words ¡oZen ¡bundle ¡together ¡as ¡a ¡ phrase ¡to ¡express ¡a ¡coherent ¡meaning; ¡we ¡call ¡them ¡ nuggets ¡ – Nuggets ¡are ¡substrings ¡in ¡ q n , ¡similar ¡to ¡phrases ¡but ¡not ¡ necessarily ¡as ¡seman)cally ¡coherent ¡as ¡phrases ¡ – Using ¡nuggets ¡to ¡form ¡structured ¡query ¡could ¡be ¡more ¡ effec)ve ¡than ¡using ¡plain ¡free ¡text ¡query ¡ ¡ servering ¡spinal ¡cord ¡paralysis ¡ servering ¡#1(spinal ¡cord) ¡paralysis ¡ word ¡ nugget ¡ word ¡ 4 ¡ 2 ¡

  3. 11/12/12 ¡ How ¡to ¡Iden)fy ¡Nuggets ¡ • More ¡Observa)ons: ¡ – a ¡valid ¡nugget ¡(within ¡a ¡query) ¡appears ¡frequently ¡in ¡the ¡ top ¡returned ¡snippets ¡for ¡the ¡query ¡ – Even ¡if ¡the ¡words ¡in ¡a ¡nugget ¡do ¡not ¡appear ¡con=nuously ¡ in ¡the ¡snippets, ¡they ¡appear ¡close. ¡ ...preservation uk spinal cord injury care in egypt cky cord noats guitar viewsonic power cord malfunction spinal cord stimulator...injury spinal cord dell...extension cord nylon... cord paralysis vocal vegas… A ¡sample ¡snippet ¡for ¡TREC ¡2012 ¡session ¡53 ¡query ¡ servering ¡spinal ¡cord ¡ paralysis , ¡where ¡“spinal ¡cord” ¡are ¡grouped ¡as ¡a ¡nugget ¡#1(spinal ¡cord) ¡ 5 ¡ How ¡to ¡Iden)fy ¡Nuggets ¡ 1. Send ¡ q n ¡ to ¡Lemur, ¡get ¡ini)al ¡retrieval ¡results ¡ 2. look ¡for ¡possible ¡nuggets ¡in ¡the ¡top ¡ k ¡ snippets ¡ – High ¡frequency ¡adjacent ¡words ¡ – Other ¡words ¡which ¡frequently ¡co-­‑occur ¡within ¡a ¡ certain ¡proximity ¡ ¡ 6 ¡ 3 ¡

  4. 11/12/12 ¡ Strict ¡Method ¡ q w w  w = 1 2 l count( w i w i + 1 ;Snippet) w i w i + 1 are connected min(count( w i w i + 1 ;Snippet),count( w i w i + 1 ;Snippet)) ≥ θ ⇒ nugget # 1 ( w w  w ) w w  w are connected = i i 1 i k i i 1 i k + + + + Example ¡ Query ¡ servering ¡spinal ¡cord ¡paralysis ¡ Snippet ¡ ...preservation uk spinal cord injury care in egypt cky cord noats guitar viewsonic power cord malfunction spinal cord stimulator...injury spinal cord dell...extension cord nylon... cord paralysis vocal vegas… Structured ¡Query ¡ RL1 ¡Query ¡ servering ¡#1(spinal ¡cord) ¡paralysis ¡ 7 ¡ Relaxed ¡Method ¡ x ( w ; S ) ∑∑ 1 k j i t Define ¡centroid ¡of ¡a ¡word ¡ w i ¡is ¡ ¡ j x ( w ) = ⋅ i k count ( w ; S ) t 1 = i t # 1 ( w w ) | x ( w ) x ( w ) | 5 ⎧ − ≤ i i 1 i i 1 + + ⎪ Predict ¡the ¡nugget ¡window ¡size ¡ nugget # 2 ( w w ) 5 | x ( w ) x ( w ) | 10 = < − ≤ ⎨ i i 1 i i 1 + + ⎪ | x ( w ) x ( w ) | 10 Example ¡ φ − > ⎩ i i 1 + Query ¡ Structured ¡Query ¡ marsupial ¡cartoon ¡character ¡ marsupial ¡#2(cartoon ¡character) ¡ Snippet ¡ …about ¡a ¡ cartoon ¡character . ¡For ¡the ¡carnivorous ¡ marsupial , ¡see ¡Tasmanian…animated ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡8 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 9 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡10 ¡ ¡ ¡ ¡ ¡ ¡ ¡11 ¡ ¡ ¡12 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡13 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 14 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡15 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡16 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡23 ¡ cartoon ¡character ¡in ¡the…series ¡of ¡ cartoons …the ¡ character ¡aZer…between ¡the ¡ ¡ ¡ ¡ ¡ ¡ ¡ 24 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡25 ¡ ¡ ¡ ¡ ¡ ¡26 ¡27 ¡ ¡ ¡ ¡ ¡ ¡ ¡32 ¡ ¡ ¡ ¡33 ¡ ¡ ¡ ¡ ¡ ¡ 34 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡38 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 39 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡40 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡55 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡56 ¡ ¡ marsupial …encyclopedia ¡ cartoon ¡character ) ¡Jump…propelled ¡the ¡ character ¡to ¡new… ¡ ¡ ¡ ¡ ¡ ¡ ¡57 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡68 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 69 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡70 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡71 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡80 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡81 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 82 ¡ ¡ ¡ ¡ ¡ ¡ ¡83 ¡ ¡84 ¡ animated ¡ cartoon ¡character …Tunes ¡series ¡of ¡ cartoons . ¡The ¡ character ¡appeared ¡in… ¡ ¡ ¡ ¡ ¡ ¡89 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 90 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡91 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡98 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡99 ¡ ¡100 ¡ ¡ ¡ 101 ¡ ¡ ¡ ¡ ¡ ¡ ¡102 ¡ ¡ ¡ ¡ ¡ ¡ 103 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡104 ¡ ¡ ¡ ¡ ¡ ¡105 ¡ x ( marsupial ) 35 = ⎫ marsupial RL1 ¡Query ¡ ⎪ ⎧ x ( cartoon ) 54 = ⇒ ⎬ ⎨ #2(cartoon character) ⎩ ⎪ 8 ¡ x ( character ) 60 = ⎭ 4 ¡

  5. 11/12/12 ¡ Query ¡Expansion ¡with ¡Previous ¡Queries ¡ 1. Extract ¡nuggets ¡and ¡words ¡from ¡every ¡query ¡ q 1 , ¡ q 2 , ¡… ¡, ¡ q n ¡in ¡a ¡session ¡ 2. Combine ¡them ¡and ¡weigh ¡them ¡by ¡per-­‑query ¡ weight ¡ λ k ¡ #weight( λ 1 #combine( nugget 11 nugget 12  nugget 1 m w 11 w 12  w 1 r ) λ 2 #combine( nugget 21 nugget 22  nugget 2 m w 21 w 22  w 2 r )  λ n #combine( nugget n 1 nugget n 2  nugget nm w n 1 w n 2  w nr ) ) RL2 ¡Query ¡ 9 ¡ Query ¡Expansion ¡with ¡previous ¡queries ¡ Weigh)ng ¡Schemes ¡ • Uniform ¡ All ¡queries ¡are ¡assigned ¡the ¡same ¡weight. ¡ ¡ 1 λ = k • Previous ¡vs. ¡current ¡ All ¡previous ¡queries ¡share ¡the ¡same ¡weight ¡while ¡the ¡ current ¡query ¡uses ¡a ¡complementary ¡and ¡higher ¡ weight ¡ k 1 , 2 ,  n 1 λ ⎧ = − p ¡ 0 . 4 λ = λ = ⎨ p k 1 k n − λ = ¡ ⎩ p • Distance-­‑based ¡ The ¡weights ¡are ¡distributed ¡based ¡on ¡how ¡far ¡a ¡query’s ¡ posi)on ¡in ¡the ¡session ¡is ¡from ¡the ¡current ¡query ¡ λ ⎧ p k 1 , 2 ,  n 1 ⎪ = − 0 . 4 λ = λ = n k ⎨ − p k 1 k n ⎪ − λ = 10 ¡ ⎩ p 5 ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend