Best Prac*ces for Sharing Language Technology Resources in - - PowerPoint PPT Presentation

best prac ces for sharing language technology resources
SMART_READER_LITE
LIVE PREVIEW

Best Prac*ces for Sharing Language Technology Resources in - - PowerPoint PPT Presentation

Best Prac*ces for Sharing Language Technology Resources in Minority Language Environments Delyth Prys Bangor University, Wales d.prys@bangor.ac.uk The Language


slide-1
SLIDE 1

Best ¡Prac*ces ¡for ¡Sharing ¡Language ¡ Technology ¡Resources ¡in ¡Minority ¡ Language ¡Environments ¡

Delyth ¡Prys ¡ Bangor ¡University, ¡Wales ¡ d.prys@bangor.ac.uk ¡ ¡

slide-2
SLIDE 2

The ¡Language ¡Technologies ¡Unit, ¡ Bangor ¡University ¡

  • Self-­‑funded ¡research ¡unit ¡
  • Established ¡as ¡the ¡Centre ¡for ¡the ¡

StandardizaCon ¡of ¡Welsh ¡Terminology ¡in ¡1993 ¡

  • Expanded ¡scope ¡from ¡2001 ¡onwards ¡to ¡

include ¡Speech ¡and ¡Language ¡Technologies ¡

  • Focus ¡on ¡Welsh ¡and ¡other ¡minoriCzed/less-­‑

resourced ¡languages ¡

slide-3
SLIDE 3

The ¡Welsh ¡Na*onal ¡Terminology ¡Portal ¡

h@p://techiaith.org/ ¡

slide-4
SLIDE 4

The ¡Problem ¡

  • Lack ¡of ¡easily ¡accessible ¡tools ¡for ¡developing ¡

LT ¡for ¡Welsh ¡

  • Expense ¡of ¡developing ¡tools ¡for ¡languages ¡

which ¡are ¡not ¡commercially ¡interesCng ¡

  • Many ¡useful ¡LT ¡tools/resources ¡developed ¡
  • ver ¡the ¡years ¡for ¡internal ¡use ¡not ¡available ¡to ¡
  • thers ¡
  • Lack ¡of ¡knowledge ¡by ¡soQware/web ¡

developers ¡etc ¡on ¡how ¡to ¡use ¡these ¡resources ¡ ¡

slide-5
SLIDE 5

The ¡Solu*on ¡

  • Hold ¡an ¡audit ¡of ¡all ¡tools/resources ¡developed ¡

by ¡the ¡LTU ¡that ¡are ¡available ¡for ¡reuse ¡

  • Select ¡the ¡most ¡important ¡ones ¡for ¡

repackaging ¡and ¡disseminaCon ¡

  • Create ¡a ¡free, ¡accessible ¡on-­‑line ¡portal ¡ ¡
  • Include ¡documentaCon, ¡tutorials ¡and ¡ideas ¡for ¡

use ¡

slide-6
SLIDE 6

Ini*al ¡resources ¡selected ¡

  • 1. Social ¡web ¡corpora ¡(TwiUer ¡and ¡Facebook) ¡ ¡
  • 2. Welsh<>English ¡Machine ¡TranslaCon ¡
  • 3. Welsh<>English ¡Aligner ¡for ¡preparing ¡parallel ¡

texts ¡

  • 4. Welsh ¡Text-­‑to-­‑Speech ¡API ¡service ¡
  • 5. Welsh ¡FesCval ¡Speech ¡Synthesis ¡resources ¡
  • 6. Spelling ¡and ¡grammar ¡checker ¡API ¡and ¡widget ¡
  • 7. PoS ¡Tagger ¡API ¡
  • 8. Language ¡DetecCon ¡API ¡
  • 9. ‘Vocab’ ¡bilingual ¡dicConaries ¡widget ¡
slide-7
SLIDE 7
slide-8
SLIDE 8
slide-9
SLIDE 9
slide-10
SLIDE 10
slide-11
SLIDE 11
slide-12
SLIDE 12

‘Vocab’ ¡widget ¡installed ¡on ¡ newspaper ¡website ¡ ¡

slide-13
SLIDE 13

‘Vocab’ ¡dic*onary ¡selected ¡on ¡text ¡

slide-14
SLIDE 14

Conclusions ¡

  • Successfully ¡addresses ¡needs ¡of ¡both ¡local ¡and ¡

internaConal ¡developers ¡

– Hence ¡NaConal ¡Portal ¡+ ¡use ¡Github ¡and ¡other ¡ internaConal ¡repositories ¡ ¡ – APIs ¡and ¡widgets ¡have ¡proved ¡very ¡popular ¡(due ¡to ¡ demand ¡from ¡web ¡developers?) ¡

  • Increases ¡interest ¡in ¡open ¡source ¡LTs ¡such ¡as ¡

Moses ¡and ¡FesCval ¡

  • Further ¡queries ¡from ¡public ¡organisaCons ¡show ¡

the ¡need ¡to ¡prioriCze ¡ease ¡of ¡use ¡to ¡end ¡users ¡