SLIDE 1
Mul$modal Interfaces Shiri Azenkot May 29, 2013 LNG 575 - - PowerPoint PPT Presentation
Mul$modal Interfaces Shiri Azenkot May 29, 2013 LNG 575 - - PowerPoint PPT Presentation
Mul$modal Interfaces Shiri Azenkot May 29, 2013 LNG 575 Mul$modal Interface Papers Ovia%. 2012. Mul$modal Interfaces Feng et al. 2011. Speech and
SLIDE 2
SLIDE 3
Mul$modal ¡Interface ¡Papers ¡
Suhm ¡et ¡al. ¡2001. ¡ Mul$modal ¡Error ¡Correc$on ¡for ¡Speech ¡User ¡Interfaces ¡ Paek ¡et ¡al. ¡2008. ¡ Search ¡Vox: ¡Leveraging ¡Mul$modal ¡Refinement ¡and ¡ ¡ Par$al ¡Knowledge ¡for ¡Voice ¡Search ¡ Feng ¡et ¡al. ¡2011. ¡ Speech ¡and ¡Mul$modal ¡Interac$on ¡in ¡Mobile ¡Search ¡ Ovia%, ¡Gent. ¡1996. ¡ Error ¡Resolu$on ¡During ¡Mul$modal ¡Human-‑Computer ¡Interac$on ¡ Ovia%. ¡2012. ¡ Mul$modal ¡Interfaces ¡ ¡
SLIDE 4
What ¡is ¡a ¡ ¡ mul$modal ¡Interface? ¡
SLIDE 5
SLIDE 6
SLIDE 7
Suhm ¡et ¡al. ¡2001. ¡
Mul$modal ¡Error ¡Correc$on ¡for ¡ Speech ¡User ¡Interfaces ¡
SLIDE 8
The ¡Problem ¡
- Speech ¡recogni$on ¡systems ¡are ¡limited ¡
- Correc$ng ¡errors ¡is ¡challenging ¡
¡“repair ¡problem” ¡
SLIDE 9
Mul$modal ¡Dicta$on ¡System ¡
Dicta$on ¡recognizer ¡+ ¡ ¡ mul$modal ¡error ¡correc$on ¡
SLIDE 10
SLIDE 11
SLIDE 12
SLIDE 13
Gesture ¡ ¡ Recogni$on ¡
SLIDE 14
Evalua$on ¡
- Hypotheses: ¡
– Mul$modal ¡correc$on ¡is ¡faster ¡ – Detec$ng ¡poten$al ¡errors ¡automa$cally ¡speeds ¡ up ¡correc$on ¡process ¡ – Users ¡prefer ¡fastest ¡modality ¡
SLIDE 15
Evalua$on ¡
- Tasks: ¡par$cipants ¡read ¡newspapers ¡
- Factors: ¡
– Correc$on ¡modality ¡
- Measures: ¡
– Input ¡rate ¡(WPM) ¡ – System ¡response ¡$me ¡ – Recogni$on ¡accuracy ¡ – Correc$on ¡accuracy ¡ – Correc$on ¡speed ¡
SLIDE 16
Correc$on ¡accuracy ¡for ¡modality ¡
SLIDE 17
Use ¡of ¡different ¡modali$es ¡
SLIDE 18
Paek ¡et ¡al. ¡2008. ¡
Search ¡Vox: ¡Leveraging ¡Mul$modal ¡ Refinement ¡and ¡ ¡Par$al ¡Knowledge ¡ for ¡Voice ¡Search ¡
SLIDE 19
The ¡Problem ¡
Voice ¡search ¡is ¡common ¡ ¡ Challenges ¡of ¡voice ¡search ¡on ¡mobile ¡devices ¡
- 1. Noisy ¡environments ¡
- 2. User ¡compensate ¡in ¡unhelpful ¡ways ¡
SLIDE 20
SLIDE 21
Text ¡hints ¡
SLIDE 22
Using ¡par$al ¡knowledge ¡
SLIDE 23
Evalua$on ¡
- Simula$on ¡using ¡DB ¡of ¡voice ¡search ¡u^erances ¡
- Experiments ¡with ¡cases ¡where ¡ASR ¡failed ¡
SLIDE 24
Recovery ¡Rate ¡with ¡Mul$modal ¡ ¡ Word ¡Pale^e ¡
SLIDE 25
Feng ¡et ¡al. ¡2011. ¡
Speech ¡and ¡Mul$modal ¡ Interac$on ¡in ¡Mobile ¡Search ¡
SLIDE 26
Challenges ¡for ¡Mul$modal ¡Interfaces ¡ for ¡Voice ¡Search ¡
- Mul$modal ¡microphone ¡ac$va$on ¡
- Mul$modal ¡confirma$on ¡and ¡error ¡correc$on ¡
- Mul$modal ¡input ¡and ¡integra$on ¡
SLIDE 27
Speak4It ¡
SLIDE 28
SLIDE 29
Ovia%, ¡Gent. ¡1996. ¡
Error ¡Resolu$on ¡During ¡Mul$modal ¡ Human-‑Computer ¡Interac$on ¡
SLIDE 30
Ques$on ¡
How ¡do ¡users ¡use ¡different ¡modali$es ¡in ¡ mul$modal ¡error ¡correc$on? ¡
SLIDE 31
Ques$on ¡
How ¡do ¡users ¡use ¡different ¡modali$es ¡in ¡ mul$modal ¡error ¡correc$on? ¡ ¡ Hypothesis: ¡ Users ¡will ¡switch ¡modali$es ¡and ¡use ¡different ¡ words ¡making ¡correc$ons. ¡They ¡are ¡more ¡likely ¡ to ¡do ¡this ¡as ¡their ¡a^empts ¡to ¡correct ¡errors ¡fail. ¡
SLIDE 32
Study ¡
- Par$cipants: ¡20 ¡na$ve ¡English ¡speakers ¡
- Apparatus: ¡car ¡rental, ¡conference ¡registra$on ¡
assistant ¡system. ¡
– pen ¡+ ¡speech ¡input ¡ – Simulated ¡speech ¡rec ¡w/errors ¡ – “Spiral ¡depth”: ¡ ¡1 ¡– ¡6 ¡
- Procedure: ¡par$cipants ¡completed ¡
transac$ons ¡as ¡accurately ¡as ¡possible. ¡
¡
SLIDE 33
Prototype ¡system ¡
System ¡asks: ¡where ¡would ¡you ¡like ¡to ¡pick ¡up ¡your ¡car? ¡ Users ¡speaks: ¡“san ¡francisco” ¡ System ¡displays ¡simulated ¡error: ¡“???” ¡
SLIDE 34
Results ¡
- Modality ¡preference ¡– ¡Speech ¡over ¡wri^en ¡
- Simultaneous ¡use ¡of ¡modes ¡
Barely ¡– ¡only ¡0.7% ¡of ¡all ¡words ¡
- Modality ¡alterna$ves ¡
Increased ¡when ¡people ¡corrected ¡errors ¡ Peaked ¡at ¡spiral ¡depth ¡5 ¡(40% ¡probability) ¡
- Lexical ¡alterna$on ¡
Probability ¡fluctuated ¡
SLIDE 35
Probability ¡of ¡ ¡ spiral ¡depth ¡and ¡ ¡lexical ¡altera$on ¡
SLIDE 36
Ovia%. ¡2012. ¡
Mul$modal ¡Interfaces ¡
SLIDE 37
Goals ¡of ¡mul$modal ¡interfaces ¡
- Accommodate ¡ ¡
– User ¡skill ¡& ¡preference ¡ – Different ¡situa$ons ¡
- Increase ¡efficiency ¡
- Be^er ¡error ¡handling ¡