Simultaneous ¡Transla/on ¡for ¡Hiero ¡
¡
Simon ¡Fraser ¡University ¡
Simultaneous Transla/on for Hiero Simon Fraser University - - PowerPoint PPT Presentation
Simultaneous Transla/on for Hiero Simon Fraser University Maryam Siahbani, Anoop Sarkar Hierarchical Phrase-based Transla/on (Hiero) Synchronous Context-Free Grammar
¡
Simon ¡Fraser ¡University ¡
Phrase ¡pairs ¡ Decoder ¡
Synchronous Context-Free Grammar
2 ¡
Align ¡Words ¡
En ¡
Zh ¡
SCFG ¡ Output ¡ transla5on ¡
X ¡-‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<事情 ¡/ ¡what ¡> ¡ 我们 十分 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡ 地区 ¡ 非洲 ¡
Find ¡the ¡correct ¡transla/on ¡ for ¡new ¡input ¡
X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ we ¡are ¡very ¡much ¡ ¡ X-‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ concerned ¡with ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡happens ¡in ¡ what ¡ African ¡regions ¡ X ¡-‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X-‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ X ¡-‑> ¡ ¡<事情 ¡/ ¡what ¡> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡
O(n^3) ¡ Language ¡Model ¡(LM) ¡ computa>on ¡
3 ¡
我们 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡ 。 ¡
we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡African ¡regions ¡. ¡
X_2 ¡ X_1 ¡
X_2= ¡what ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ X ¡-‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/ ¡concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ X_1= ¡African ¡regions ¡ concerned ¡with ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡happens ¡in ¡ what ¡ ¡African ¡regions ¡
LM ¡ LM ¡ LM ¡
BoEom-‑up ¡parsing ¡ algorithm ¡
we ¡are ¡very ¡much ¡concerned ¡with ¡
African ¡regions ¡ ¡
的 ¡
X ¡-‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ <s> ¡[0,8] ¡ <s> ¡ ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡
我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡
X ¡-‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-‑> ¡ ¡<的 ¡/ ¡in ¡> ¡
we ¡are ¡very ¡much ¡ [2,8] ¡ concerned ¡with ¡ [3,8] ¡ what ¡happens ¡ [6,7] ¡[3,5] ¡ in ¡ [3,5] ¡
4 ¡
LM ¡ LM ¡
5 ¡
Hiero ¡(CKY) ¡
(Chiang ¡ACL’05) ¡
LR ¡target ¡genera/on ¡
(Watanabe ¡et ¡al., ¡ ACL’06) ¡
LR-‑Hiero ¡ Augmented ¡LR-‑Decoding ¡
(Siahbani ¡et ¡al., ¡EMNLP’13) ¡
Improve ¡LR-‑Hiero ¡
(Siahbani ¡&Sarkar ¡EMNLP’14) ¡ (Siahbani ¡& ¡Sarkar ¡AMTA’14) ¡ (Siahbani ¡et ¡al ¡SLT’14) ¡
17 ¡ 19 ¡ 21 ¡ 23 ¡ 25 ¡ 27 ¡ 29 ¡ 0 ¡ 2000 ¡ 4000 ¡ 6000 ¡ 8000 ¡ BLEU ¡ LM ¡Calls ¡ Czech-‑English ¡ German-‑English ¡ Chinese-‑English ¡
LR-‑Hiero ¡ Hiero ¡
6 ¡
7 ¡
X ¡-‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ X ¡-‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-‑> ¡ ¡<的 ¡/ ¡in ¡> ¡
X ¡-‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡
Non-‑GNF ¡
hgp://site.interpretereduca/ononline.com/interpre/ng-‑jokes/ ¡
的 ¡
<s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡
我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡
10 ¡
X ¡-‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡
?? ¡ ?? ¡
13 ¡
(Matusov ¡IWSLT’06) ¡ (Fügen ¡et ¡al., ¡MT’07) ¡ (Bangalore ¡et ¡al., ¡ NAACL’12) ¡ (Fujita ¡et ¡al ¡ InterSpeech’13) ¡ (Yarmohammadi ¡et ¡al ¡IJCNLP’13) ¡ (Oda ¡et ¡al ¡ACL’14) ¡ (Grissom ¡et ¡al ¡ EMNLP ¡’14) ¡ (Mieno ¡et ¡al ¡InterSpeech’15) ¡ Prehistory: ¡ Batch ¡and ¡Monotone ¡ ¡ (Tillmann ¡et ¡al., ¡ACL’1997) ¡ (Pytlik ¡and ¡Yarowsky, ¡AMTA’06) ¡
(Siahbani ¡et ¡al, ¡SLT ¡2014) ¡
– IWSLT ¡2011 ¡shared ¡task: ¡English-‑French ¡TED ¡talks ¡
– EuroParl ¡v7 ¡plus ¡IWSLT ¡2011 ¡shared ¡task ¡data ¡
– WMT ¡2011 ¡French ¡data ¡(EuroParl, ¡News ¡ Commentary, ¡UN) ¡
– IWSLT ¡2010 ¡shared ¡task ¡data ¡(dev2010, ¡tst2010) ¡
– Word ¡at ¡segment ¡ boundary ¡(punct, ¡conj) ¡ – Posi/on ¡of ¡boundary ¡ – Length ¡of ¡segment ¡
– Trigram ¡before ¡segment ¡ – Bi/trigram ¡at ¡end ¡of ¡ segment ¡
– Language ¡model ¡(lm) ¡ – P(e|f) ¡phrase ¡pair ¡(tm0) ¡ – P(f|e) ¡phrase ¡pair ¡(tm1) ¡ – Lex(e|f) ¡lexical ¡(tm3) ¡ – Lex(f|e) ¡lexical ¡(tm4) ¡ – Log-‑linear ¡model ¡score ¡ (c) ¡
segmenter ¡F1 ¡= ¡81.6% ¡
– Basic ¡+ ¡POS ¡+ ¡(lm,tm0,c) ¡
– Take ¡reordering ¡into ¡account ¡ – Let ¡the ¡decoder ¡decide ¡ – The ¡“least ¡worst” ¡BLEU ¡score ¡for ¡different ¡ segment ¡lengths ¡may ¡result ¡in ¡varying ¡speed ¡
21 ¡
22 ¡
– Smaller ¡phrases ¡are ¡replaced ¡by ¡non-‑terminal ¡X ¡
– Uniformly ¡distribute ¡the ¡frac/onal ¡count ¡to ¡all ¡rules ¡ extracted ¡from ¡the ¡phrase-‑pair ¡
¡ ¡
24 ¡
X ¡-‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡
happens ¡ 发生 ¡ 事情 ¡ 我们十分 ¡ 关注 ¡ 的 ¡ we ¡are ¡very ¡much ¡ concerned ¡with ¡ what ¡ in ¡ region ¡ 地区 ¡ 非洲 ¡ African ¡
X_1 ¡
¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡X_1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ X_1 ¡ X_2 ¡ X_2 ¡ X_1 ¡
Constraints: ¡
Length ¡of ¡phrase-‑pairs ¡(usually ¡10) ¡ At ¡most ¡2 ¡non-‑terminals ¡ Non-‑adjacent ¡non-‑terminals ¡on ¡the ¡source ¡side ¡ X ¡-‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡ X ¡-‑> ¡ ¡<X_1 ¡的 ¡X_2 ¡/ ¡X_2 ¡X_1 ¡in> ¡ X ¡-‑> ¡ ¡<X_1 ¡事情 ¡/ ¡what ¡X_1> ¡ X ¡-‑> ¡ ¡<发生 的 ¡X_1 ¡/ ¡X_1 ¡happens ¡in> ¡ X ¡-‑> ¡ ¡<发生 的 事情 ¡/ ¡what ¡happens ¡in> ¡
happens ¡ 发生 ¡ 事情 ¡ 的 ¡ what ¡ in ¡
1 ¡ 0.25 ¡ 0.25 ¡ 0.25 ¡ 0.25 ¡
¡
CKY ¡decoders ¡
non-‑terminals) ¡ ¡
– increases ¡the ¡/me ¡complexity ¡of ¡rule ¡extrac/on ¡ ¡
zhe ¡ hui ¡ zhōngguo ¡hé ¡èluósī ¡ de ¡ guānxi ¡ fāzhǎn ¡ 。 ¡
This ¡ will ¡produce ¡
the ¡development ¡ China ¡and ¡Russia ¡ ¡ rela/ons ¡ .
dui ¡
any ¡effect ¡
hui ¡chǎnshēng ¡ shenme ¡yǐngxiǎng ¡
X_1 ¡ X_2 ¡ X_3 ¡
25 ¡
LR-‑Decoding ¡ ¡ ¡O(n^2) ¡
26 ¡
Largest ¡Right ¡Sub-‑phrase ¡(LRS) ¡
right ¡boundary ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡
ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡
2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡
gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡
2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡
ihre ¡ arbeit ¡ gemacht ¡ not ¡ yet ¡ their ¡ nicht ¡ noch ¡ work ¡ done ¡
LRS(2,5) ¡= ¡[4,5] ¡ LRS(2,7) ¡= ¡[5,7] ¡ LRS(5,7) ¡= ¡[6,7] ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ (1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(6,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡
O(m^2) ¡
X-‑> ¡< ¡SOURCE ¡/ ¡a ¡b ¡X_1 ¡…X_n> ¡
phrase ¡pairs ¡are ¡iden/fied ¡to ¡their ¡target ¡spans ¡
27 ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ 0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡
ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡
(1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡ 2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡
not ¡ yet ¡ nicht ¡ noch ¡ [2,4] ¡ [5,7] ¡
(3,4) ¡ 5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡
ihre ¡ arbeit ¡ their ¡ work ¡
(6,7) ¡
[3,4] ¡ X-‑> ¡<noch ¡/ ¡yet> ¡ X-‑> ¡<X_1 ¡nicht/not ¡X_1> ¡ X-‑> ¡<noch ¡nicht/not ¡yet> ¡ X-‑> ¡<ihre ¡arbeit/their ¡work> ¡ X-‑> ¡<ihre ¡X_1/their ¡X_1> ¡ [6,7] ¡ X-‑> ¡<arbeit ¡/ ¡work> ¡
2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡
gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡ [4,5] ¡ X-‑> ¡<gemacht ¡/ ¡done> ¡ [2,5] ¡ X-‑> ¡<noch ¡nicht ¡gemacht/not ¡yet ¡done> ¡ X-‑> ¡<noch ¡nicht ¡X_1/not ¡yet ¡X_1> ¡ X-‑> ¡<X_1 ¡nicht ¡X_2/not ¡X_1 ¡X_2> ¡ X-‑> ¡<X_1 ¡X_2/ ¡X_1 ¡X_2> ¡ X-‑> ¡<noch ¡nicht ¡X_1/not ¡yet ¡X_1> ¡
LRS ¡ X ¡ X ¡ X ¡ X ¡
new ¡
⌐old ¡ ⌐new ¡
100.9 ¡M ¡ 89.0 ¡M ¡ 0 ¡
Zh-‑En ¡
SCFG ¡& ¡ ¡old ¡GNF: ¡ ¡ini/al ¡phrase ¡length ¡10, ¡maximum ¡source ¡length ¡ ¡7, ¡ ¡2 ¡non-‑terminals ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡ Model ¡size ¡(million) ¡ SCFG ¡
GNF-‑4 ¡
28 ¡
GNF-‑4: ¡ ¡all ¡phrase ¡pairs, ¡maximum ¡source ¡length ¡ ¡10, ¡ ¡4 ¡non-‑terminal ¡ new ¡
⌐old ¡ ⌐new ¡
116.0 ¡M ¡ 98.8 ¡M ¡ 0 ¡
De-‑En ¡
new ¡
⌐old ¡ ⌐new ¡
306.3 ¡M ¡ 74.6 ¡M ¡ 0 ¡
Cs-‑En ¡
Kriya ¡
0 ¡ 1000 ¡ 2000 ¡ 3000 ¡ 4000 ¡ 5000 ¡ 6000 ¡ 7000 ¡ 8000 ¡ Average ¡# ¡LM ¡calls ¡
GNF-‑1 ¡ GNF-‑2 ¡ GNF-‑3 ¡ GNF-‑4 ¡ Average ¡number ¡of ¡language ¡model ¡calls ¡on ¡sample ¡set ¡of ¡50 ¡sentences ¡ from ¡ ¡testset. ¡ GNF-‑x ¡(new ¡GNF ¡rules): ¡ ¡x ¡non-‑terminal ¡ ¡
29 ¡
GNF-‑x ¡(new ¡GNF ¡rules): ¡maximum ¡source ¡length ¡ ¡10, ¡ ¡x ¡non-‑terminal ¡
30 ¡
19 ¡ 20 ¡ 21 ¡ 22 ¡ 23 ¡ 24 ¡ 25 ¡ 26 ¡ 27 ¡
Czech-‑English ¡ German-‑English ¡ Chinese-‑English ¡
BLEU ¡
GNF-‑1 ¡ GNF-‑2 ¡ GNF-‑3 ¡ GNF-‑4 ¡
0.27 ¡
Model ¡
Czech-‑English ¡ German-‑English ¡ Chinese-‑English ¡
SCFG ¡ 318 ¡ 351 ¡ 187 ¡
278 ¡ 300 ¡ 132 ¡ GNF-‑4 ¡ 306 ¡ 375 ¡ 163 ¡
Number ¡of ¡sentences ¡(devset) ¡covered ¡in ¡forced ¡decoding ¡mode ¡
– ¡Improve ¡alignment ¡coverage ¡ ¡ – Marginally ¡affects ¡decoding ¡speed ¡
32 ¡
33 ¡
– ¡Cs-‑En, ¡De-‑En, ¡Zh-‑En ¡
Corpus ¡(train;dev;test) ¡ Cs-‑En ¡ Europarl(v7)+CzEng(v0.9); ¡News ¡commentary(nc) ¡ 2008&2009; ¡nc ¡2011 ¡ 7.95M/3k/3k ¡ De-‑En ¡ Europarl(v7); ¡WMT2006; ¡WMT2006 ¡ 1.5M/2k/2k ¡ Zh-‑En ¡
HK ¡parallel-‑tex+GALE ¡ph-‑1; ¡MTC ¡parts ¡1&3; ¡MTC ¡part ¡4 ¡
2.3M/1928/919 ¡
34 ¡
– SCFG ¡ – GNF ¡
– Maximum ¡2 ¡non-‑terminals ¡ – maximum ¡source ¡length ¡7 ¡ ¡ – ini/al ¡phrase ¡length ¡10 ¡
– Maximum ¡4 ¡non-‑terminals ¡ – Maximum ¡source ¡length ¡10 ¡ – All ¡phrase ¡pairs ¡(including ¡sentence ¡level) ¡
35 ¡
的 ¡
X ¡-‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ <s> ¡[0,8] ¡ <s> ¡ ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡
我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡
X ¡-‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-‑> ¡ ¡<的 ¡/ ¡in ¡> ¡
we ¡are ¡very ¡much ¡ [2,8] ¡ concerned ¡with ¡ [3,8] ¡ what ¡happens ¡ [6,7] ¡[3,5] ¡ in ¡ [3,5] ¡ African ¡ regions ¡ ¡
36 ¡
LM ¡ LM ¡
X ¡-‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ X ¡-‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-‑> ¡ ¡<的 ¡/ ¡in ¡> ¡
X ¡-‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡
Non-‑GNF ¡
37 ¡
Largest ¡Right ¡Sub-‑phrase ¡(LRS) ¡
right ¡boundary ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡
ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡
2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡
gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡
2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡
ihre ¡ arbeit ¡ gemacht ¡ not ¡ yet ¡ their ¡ nicht ¡ noch ¡ work ¡ done ¡
LRS(2,5) ¡= ¡[4,5] ¡ LRS(2,7) ¡= ¡[5,7] ¡ LRS(5,7) ¡= ¡[6,7] ¡
0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡
Sub-‑problem ¡
(1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(6,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡
O(m^2) ¡
38 ¡
and ¡target ¡side ¡are ¡reordered) ¡
39 ¡
words ¡covered ¡
hypotheses ¡for ¡a ¡given ¡stack ¡
40 ¡
rules ¡ ¡
current ¡stack ¡
41 ¡
42 ¡
43 ¡
44 ¡
. O(n3) ¡ LM ¡computa>on ¡
45 ¡
我们 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡
we ¡are ¡very ¡much ¡ with ¡ ¡ what ¡ in ¡ region ¡
地区 ¡ 十分 ¡ 非洲 ¡
African ¡ happens ¡
。 ¡
concerned ¡ we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡African ¡regionss ¡. ¡ O(n3b) ¡
Tā ¡shuō ¡, ¡ ¡ ¡zài ¡fǎngwèn ¡ ¡rìběn ¡de ¡ ¡4 ¡ ¡/ān ¡ ¡qíjiān ¡ ¡ ¡, ¡ ¡ ¡ ¡tā ¡ ¡ ¡jiāng ¡jìnxíng ¡ ¡ ¡shēnrù ¡tǎolùn ¡ ¡ ¡. ¡ ¡ he ¡said ¡, ¡ ¡ ¡he ¡ ¡will ¡conduct ¡ ¡ ¡detailed ¡discussions ¡ ¡during ¡ ¡four-‑day ¡ ¡ ¡ ¡visit ¡ ¡ ¡in ¡japan ¡ ¡ ¡ ¡. ¡