Machine Translation: Word Alignment Problem
Marcello Federico FBK, Trento - Italy 2013
- M. Federico
MT 2013 1
Outline
- Word alignments
- Word alignment models
- Alignment search
- Alignment estimation
- EM algorithm
- M. Federico
MT 2013
Machine Translation: Word Alignment Problem Marcello Federico FBK, - - PDF document
Machine Translation: Word Alignment Problem Marcello Federico FBK, Trento - Italy 2013 M. Federico MT 2013 Outline 1 Word alignments Word alignment models Alignment search Alignment estimation EM algorithm M. Federico
MT 2013 1
MT 2013
2
MT 2013 3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow
MT 2013
3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow
MT 2013 3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow
MT 2013
3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow NULL
MT 2013 3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow NULL
MT 2013
3
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow NULL
MT 2013 4
blow 9 · · · ·
· · · will 8 · · · · · · · · · wind 7 · · · · · · ·
chilly 6 · · · · · ·
· eastern 5 · · · · · · · ·
· · · · ·
· · evening 3 ·
· · · · · · tomorrow 2 · · ·
· · · · since 1
· · · · · · ·
1 2 3 4 5 6 7 8 9
d a l l a s e r a t a d i d
a n i s
f i e r ` a u n f b l a c k d
e n t
i e n t a l e
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow
MT 2013
4
blow 9 · · · ·
· · · will 8 · · · · · · · · · wind 7 · · · · · · ·
chilly 6 · · · · · ·
· eastern 5 · · · · · · · ·
· · · · ·
· · evening 3 ·
· · · · · · tomorrow 2 · · ·
· · · · since 1
· · · · · · · NULL 0 · ·
· · · · ·
1 2 3 4 5 6 7 8 9
d a l l a s e r a t a d i d
a n i s
f i e r ` a u n f b l a c k d
e n t
i e n t a l e
dalla
1
domani un serata soffierà freddo vento di
9 8 7 6 5 4 3 2 1
since
3 2 8 4 9 6 5 7
blow will wind chilly eastern an evening tomorrow NULL
MT 2013 5
1 2 3 4 5 6 7
MT 2013
6
1 2 3 4
MT 2013 7
MT 2013
8
Alignment Model Pr(a,f|e)
MT 2013 9
Alignment Model Pr(a,f|e)
1Indeed, l + 1 if we want to include the null word.
MT 2013
10
l=5 m=7 3 5 4 5 5 1 2
words chosen through a probability table positions picked randomly
MT 2013 11
Alignment Model Pr(a,f|e)
MT 2013
12
0.1 a the ein das 0.85 0.8 0.12 0.02 0.04 0,05 0.03 0.03 Buch Haus 0.01 0.07 0.02 0.01 0.02 0.92 0.92 book house
MT 2013 13
vento freddo un soffierà domani di serata dalla blow will wind chilly eastern an evening tomorrow since un Alpi le interessa est da freddo vento eastern Alps the affects breeze cool an
e count(e, f) = count(e, f)
MT 2013
14
vento freddo un soffierà domani di serata dalla blow will wind chilly eastern an evening tomorrow since eastern Alps the affects breeze cool an un Alpi le interessa est da freddo vento
MT 2013 15
BILINGUAL CORPUS INITIAL PARAM IMPROVE ESTIMATE PARAM
loop until convergencence
MT 2013
16
MT 2013 17
MT 2013
18
MT 2013 19
MT 2013
20
MT 2013 21
MT 2013
22
MT 2013 23
. · · · · · · · · · · · · ·
· · · · · · · · · · · ·
nicht · · · · · · · · · ·
· · wohl · · · · ·
·
· · · das · · · · · · · ·
· · · · geht · · · · · · · · · · ·
· dann · · ·
· · · · · · · · · , · ·
·
· · · · · ja ·
· · · · · · · · · · · ah
· · · · · · · · · · · · NULL · · · · · · · · · · · · · ·
well , then , I guess , that will not work anymore .
MT 2013
24
. · · · · · · · · · · · · ·
· · · · · · · · · · · ·
nicht · · · · · · · · · ·
· · wohl · · · · ·
· · · · · · das · · · · · · · ·
· · · · geht · · · · · · · · ·
· dann · · ·
· · · · · · · · · , · ·
· · · · · · · · · · ja ·
· · · · · · · · · · · ah
· · · · · · · · · · · · NULL · · · ·
·
· · · · ·
well , then , I guess , that will not work anymore .
MT 2013 25
Alignment Model Pr(a,f|e)
MT 2013
26
null0 the1 program2 has3 been4 implemented5
1 1 1 1
e'1 stato2 messo3 in4 pratica5 il6 programma7 fertility
3 il programma e` stato pratica in messo 6 7 1 2 5 4 3
tablet permutation
MT 2013 27
MT 2013
28
source source source source target target direct inverted union intersection source source direct inverted target target target target
MT 2013 29
source target direct inverted intersection source source target target source grow diagonal target source target source target grow diagonal grow diagonal
MT 2013
30
MT 2013 31
Bilingual concordance Search string: Select corpus:
Alice in Wonderland rabbit EQUAL TO Done She felt very sleepy, when suddenly a White rabbit with pink eyes ran close by her. nor did Alice think it so unusual to hear the rabbit say to itself "Oh dear! Oh dear! I shall be too late!" But when the rabbit actually took a watch out of its waistcoat-pocket, and looked at it, and then hurried on, Alice started to her feet, for she remembered that she had never before seen a rabbit with either a waistcoat-pocket or a watch to take out of it, and she ran across the field after it, and was just in time to see it pop down a large rabbit-hole under the hedge. The rabbit-hole went straight on like a tunnel for some way, and then dipped suddenly down, so suddenly that Alice had no time to think about stopping herself before she found herself falling down what seemed to be a very deep well.
Source: Target:
EN-English ZH-Chinese 她感到昏昏欲睡,就在此
呀!我要”她也不 然而当兔子居然从背心口袋中掏出一只表,瞧了 瞧,然后又匆匆赶路
MT 2013
32
MT 2013