crowdq crowdsourced query understanding
play

CrowdQ: Crowdsourced Query Understanding Gianluca - PowerPoint PPT Presentation

CrowdQ: Crowdsourced Query Understanding Gianluca Demar8ni, Beth Trushkowsky, Tim Kraska, Michael J. Franklin Scenario Find the birthdate of the mayor of


  1. CrowdQ: ¡ Crowdsourced ¡Query ¡Understanding ¡ ¡ Gianluca ¡Demar8ni, ¡Beth ¡Trushkowsky, ¡ Tim ¡Kraska, ¡Michael ¡J. ¡Franklin ¡

  2. Scenario ¡ Find ¡the ¡birthdate ¡of ¡the ¡mayor ¡of ¡the ¡capital ¡ city ¡of ¡France ¡ ¡ Gianluca ¡Demar8ni ¡ 2 ¡

  3. Gianluca ¡Demar8ni ¡ 3 ¡

  4. Gianluca ¡Demar8ni ¡ 4 ¡

  5. Gianluca ¡Demar8ni ¡ 5 ¡

  6. Gianluca ¡Demar8ni ¡ 6 ¡

  7. Mo8va8on ¡ • Web ¡Search ¡Engines ¡can ¡answer ¡simple ¡factual ¡ queries ¡directly ¡on ¡the ¡result ¡page ¡ • Users ¡with ¡complex ¡informa8on ¡needs ¡are ¡ oQen ¡unsa8sfied ¡ • Purely ¡automa8c ¡techniques ¡are ¡not ¡enough ¡ • We ¡want ¡to ¡solve ¡it ¡with ¡Crowdsourcing! ¡ Gianluca ¡Demar8ni ¡ 7 ¡

  8. Background ¡ • Crowdsourcing ¡so ¡far ¡used ¡for ¡ data ¡processing ¡ – DB/SemWeb: ¡Data ¡integra8on ¡and ¡cleaning ¡ – IR: ¡Relevance ¡judgments ¡ ¡ We ¡use ¡the ¡crowd ¡to ¡understand ¡the ¡ query ¡ Gianluca ¡Demar8ni ¡ 8 ¡

  9. CrowdQ ¡ • CrowdQ ¡is ¡the ¡first ¡system ¡that ¡uses ¡ crowdsourcing ¡to ¡ – Understand ¡the ¡intended ¡meaning ¡ – Build ¡a ¡structured ¡query ¡template ¡ – Answer ¡the ¡query ¡over ¡Linked ¡Open ¡Data ¡ Gianluca ¡Demar8ni ¡ 9 ¡

  10. Gianluca ¡Demar8ni ¡ 10 ¡

  11. CrowdQ ¡Architecture ¡ Off-­‑line : ¡query ¡template ¡genera8on ¡with ¡the ¡help ¡of ¡the ¡crowd ¡ On-­‑line : ¡query ¡template ¡matching ¡using ¡NLP ¡and ¡search ¡over ¡open ¡data ¡ Keyword Query On#line'Complex'Query Off#line'Complex'Query Processing Decomposition Complex User Query query Y POS + NER tagging query Log classifier N N Crowd Queries Templ + Match with existing Manager Structured Query Answer Types Vetrical query templates t1t2t3 selection, Unstructured Search, ... Template Generation Query Template Index Crowdsourcing Platform Structured Composition LOD Search Answer Result Joiner SERP Gianluca ¡Demar8ni ¡ 11 ¡ LOD Open Data Cloud

  12. Hybrid ¡Human-­‑Machine ¡Pipeline ¡ Q= ¡birthdate ¡of ¡actors ¡of ¡forrest ¡gump ¡ Query ¡annota8on ¡ Noun ¡ Noun ¡ Named ¡en8ty ¡ Verifica8on ¡ Is ¡forrest ¡gump ¡this ¡en8ty ¡in ¡the ¡query? ¡ En8ty ¡Rela8ons ¡ Which ¡is ¡the ¡rela8on ¡between: ¡actors ¡and ¡forrest ¡gump ¡ starring ¡ Schema ¡element ¡ Starring ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡<dbpedia-­‑owl:starring> ¡ ¡ Verifica8on ¡ Is ¡the ¡rela8on ¡between: ¡ Indiana ¡Jones ¡– ¡Harrison ¡Ford ¡ Back ¡to ¡the ¡Future ¡– ¡Michael ¡J. ¡Fox ¡ of ¡the ¡same ¡type ¡as ¡ Forrest ¡Gump ¡-­‑ ¡actors ¡ ¡ Gianluca ¡Demar8ni ¡ 12 ¡ ¡ ¡

  13. Structured ¡query ¡genera8on ¡ ¡ E I Q= ¡birthdate ¡of ¡actors ¡of ¡forrest ¡gump ¡ V O M SELECT ¡?y ¡?x ¡ WHERE ¡{ ¡?y ¡<dbpedia-­‑owl:birthdate> ¡?x ¡. ¡ ¡ ¡ ¡?z ¡<dbpedia-­‑owl:starring> ¡?y ¡. ¡ ¡ E ¡ ¡ ¡?z ¡<rdfs:label> ¡‘Forrest ¡Gump’ ¡} ¡ I V O M Results ¡from ¡BTC09: ¡ Gianluca ¡Demar8ni ¡ 13 ¡

  14. Current ¡Status ¡ • Realize ¡the ¡vision ¡ • Running ¡demo: ¡ – Daniel ¡Haas, ¡Daniel ¡Bruckner, ¡Jonathan ¡Harper ¡ • Next ¡Steps ¡ – Evalua8on ¡of ¡Crowd ¡effec8veness ¡at ¡each ¡step ¡ – Comparison ¡hybrid ¡vs ¡machine ¡pipeline ¡ Gianluca ¡Demar8ni ¡ 14 ¡

  15. Conclusions ¡ • CrowdQ: ¡an ¡hybrid ¡approach ¡to ¡complex ¡query ¡ understanding ¡ • Combines ¡techniques ¡from ¡DB, ¡NLP, ¡IR, ¡Data ¡ Mining, ¡and ¡Human ¡Intelligence ¡ ¡ • Ini8al ¡experiments ¡show ¡the ¡poten8al ¡of ¡ CrowdQ ¡ Gianluca ¡Demar8ni ¡ 15 ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend