Names Par)cipants Mark Davis Souheil Ben Yacoub - - PowerPoint PPT Presentation

names par cipants
SMART_READER_LITE
LIVE PREVIEW

Names Par)cipants Mark Davis Souheil Ben Yacoub - - PowerPoint PPT Presentation

Names Par)cipants Mark Davis Souheil Ben Yacoub Richard Ishida Doug Lawrence Gary Lefman Chris)an Lieske Juan Pane Kers)n Steffen


slide-1
SLIDE 1

Names ¡

slide-2
SLIDE 2

Par)cipants ¡

  • Mark ¡Davis ¡
  • Souheil ¡Ben ¡Yacoub ¡
  • Richard ¡Ishida ¡
  • Doug ¡Lawrence ¡
  • Gary ¡Lefman ¡
  • Chris)an ¡Lieske ¡
  • Juan ¡Pane ¡
  • Kers)n ¡Steffen ¡
  • Feiyu ¡Xu ¡
slide-3
SLIDE 3

Types ¡of ¡names ¡

  • Personal ¡names: ¡

– Full ¡name ¡ – Alterna)ve ¡names ¡

slide-4
SLIDE 4

Use ¡cases ¡

  • Recogni)on ¡

– NER, ¡Machine ¡transla)on, ¡business ¡intelligence, ¡ search, ¡iden)ty ¡resolu)on, ¡segmenta)on ¡

  • Display ¡

– Sor)ng, ¡contextual ¡usage: ¡Short, ¡Informal, ¡Full ¡name ¡ (formal, ¡postal ¡name), ¡inflexions, ¡auto-­‑comple)on, ¡ segmenta)on, ¡automa)c ¡abbrevia)on, ¡text-­‑to-­‑speech ¡

  • Capturing ¡

– Translitera)on, ¡ ¡speech-­‑to-­‑text, ¡input-­‑form-­‑input ¡

slide-5
SLIDE 5

Use ¡cases ¡

  • Business ¡intelligence: ¡Recognize ¡the ¡name ¡in ¡the ¡text ¡

– NER, ¡NED ¡(iden)ty ¡resolu)on) ¡

  • ¡

¡ ¡

  • Display: ¡genera)ng ¡names ¡

– Short, ¡Informal, ¡Full ¡name ¡(formal, ¡postal ¡name), ¡inflexion ¡

  • Segmenta)on ¡of ¡names ¡(line-­‑wrapping) ¡
  • Matching ¡
  • Auto-­‑comple)on ¡
  • Transla)on, ¡translitera)on ¡(between ¡alphabets, ¡using ¡same ¡

alphabet) ¡

  • Sor)ng ¡(given ¡names, ¡last ¡names) ¡
  • Text-­‑to-­‑speech ¡
slide-6
SLIDE 6

Problems ¡

  • Input, ¡capturing, ¡forms ¡(keep ¡the ¡context ¡to ¡be ¡able ¡to ¡

reproduce ¡the ¡sound ¡again), ¡representa)on ¡(endonym, ¡ exonym, ¡alterna)ve ¡names, ¡preferred, ¡…) ¡

  • Display ¡

– Familiarity, ¡formality, ¡context, ¡inflexion ¡(language ¡ dependent) ¡

  • Recogni)on ¡

– NED, ¡NER, ¡matching, ¡normaliza)on, ¡canoniza)on ¡

  • Search ¡(input ¡+ ¡recogni)on) ¡
  • Aliases, ¡alterna)ve ¡names, ¡abbrevia)ons, ¡preferred ¡

names ¡

slide-7
SLIDE 7

Informa)on ¡out ¡of ¡the ¡names ¡

  • Structure ¡of ¡the ¡name; ¡

– What ¡are ¡the ¡seman)cs ¡of ¡each ¡component ¡

  • Gender, ¡ ¡
  • Origin ¡(chinese, ¡roman, ¡islandic) ¡
slide-8
SLIDE 8

Problem ¡

  • Sor)ng: ¡

– How ¡to ¡recognize ¡the ¡tokens, ¡and ¡use ¡them ¡to ¡ sort ¡ ¡

  • Segmenta)on: ¡ ¡

– how ¡to ¡recognized ¡suitable ¡break ¡points ¡

  • Alterna)ve ¡names: ¡recogni)on, ¡capturing ¡
  • Component ¡names: ¡ ¡
  • Usage: ¡formal, ¡informal ¡
slide-9
SLIDE 9

Possible ¡approaches ¡

  • Name ¡structure ¡is ¡language ¡(cultural?) ¡

dependent ¡

– Changes ¡in ¡)me ¡

  • German, ¡when ¡ge]ng ¡a ¡university ¡degree ¡
  • Spanish, ¡when ¡marring ¡