Deep Learning
Sequence to Sequence models: Connectionist Temporal Classification
5 March 2018
1
Sequence to Sequence models: Connectionist Temporal Classification - - PowerPoint PPT Presentation
Deep Learning Sequence to Sequence models: Connectionist Temporal Classification 5 March 2018 1 Sequence-to-sequence modelling Problem: A sequence 1 goes in A different sequence 1 comes out
1
– A sequence 𝑌1 … 𝑌𝑂 goes in – A different sequence 𝑍
1 … 𝑍 𝑁 comes out
– Speech recognition: Speech goes in, a word sequence comes
– Machine translation: Word sequence goes in, word sequence comes out
– No synchrony between 𝑌 and 𝑍.
2
3
v
I ate an apple Ich habe einen apfel gegessen I ate an apple
Time X(t) Y(t) t=0 h-1
4
text classification
Images from Karpathy
5
𝑌0 𝑌1 𝑌2 /AH/
6
– 𝐸𝐽𝑊 𝑍
𝑢𝑏𝑠𝑓𝑢, 𝑍 = 𝑌𝑓𝑜𝑢(𝑍 𝑈 , 𝑄ℎ𝑝𝑜𝑓𝑛𝑓)
𝑌0 𝑌1 𝑌2 /AH/ Div Y(2)
7
𝐸𝐽𝑊 𝑍
𝑢𝑏𝑠𝑓𝑢, 𝑍 = 𝑢
𝑥𝑢𝑌𝑓𝑜𝑢(𝑍 𝑢 , 𝑄ℎ𝑝𝑜𝑓𝑛𝑓)
𝑌0 𝑌1 𝑌2 /AH/ Div Y(2) Fix: Use these
These too must ideally point to the correct phoneme /AH/ Div /AH/ Div
8
𝐸𝐽𝑊 𝑍
𝑢𝑏𝑠𝑓𝑢, 𝑍 = 𝑢
𝑥𝑢𝑌𝑓𝑜𝑢(𝑍 𝑢 , 𝑄ℎ𝑝𝑜𝑓𝑛𝑓)
– Only 𝑥𝑈 is high, other weights are 0 or low 𝑌0 𝑌1 𝑌2 /AH/ Div Y(2) Fix: Use these
These too must ideally point to the correct phoneme /AH/ Div /AH/ Div
9
𝐷𝑝𝑚𝑝𝑠 Blue Div Y(2) 𝑝𝑔 𝑡𝑙𝑧 Div Div
𝐸𝐽𝑊 𝑍
𝑢𝑏𝑠𝑓𝑢, 𝑍 = 𝑢
𝑥𝑢𝑌𝑓𝑜𝑢(𝑍 𝑢 , 𝑄ℎ𝑝𝑜𝑓𝑛𝑓)
– Only 𝑥𝑈 is high, other weights are 0 or low 𝑌0 𝑌1 𝑌2 /AH/ Div Y(2) We will initially focus on the class of problem where uniform weights are reasonable (e.g speech recognition) /AH/ Div /AH/ Div
10
– This is just a simple concatenation of many copies of the simple “output at the end of the input sequence” model we just saw
𝑌0 𝑌1 𝑌2 /B/ 𝑌4 𝑌5 𝑌6 /F/ 𝑌7 𝑌8 𝑌9 /IY/ 𝑌3
11
/IY/
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3 /B/
12
/F/ /IY/ /IY/
𝐸 = 𝑞𝑠𝑝𝑐(𝑡4 = 𝐸|𝑌0 … 𝑌4)
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3 /AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
13
𝑇0
′…𝑇𝐿−1 ′
′ … 𝑇𝐿−1 ′
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
14
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
15
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
– Merge adjacent repeated symbols, and place the actual emission
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
16
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
/G/ /F/ /IY/ /D/
– Merge adjacent repeated symbols, and place the actual emission
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
17
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
/G/ /F/ /IY/ /D/ Cannot distinguish between an extended symbol and repetitions of the symbol /F/
– Merge adjacent repeated symbols, and place the actual emission
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
18
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
/G/ /F/ /IY/ /D/ Cannot distinguish between an extended symbol and repetitions of the symbol /F/ Resulting sequence may be meaningless (what word is “GFIYD”?)
allowed
– E.g. only allow sequences corresponding to dictionary words – E.g. Sub-symbol units (like in HW1 – what were they?)
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
19
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
allowed
– E.g. only allow sequences corresponding to dictionary words – E.g. Sub-symbol units (like in HW1 – what were they?)
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
20
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3 /B/
21
/F/ /IY/ /IY/
𝑌0 𝑌1 𝑌2 /B/ 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
22
/F/ /IY/ /IY/
2, 𝐶 + 𝑌𝑓𝑜𝑢 𝑍 4, 𝐽𝑍 + 𝑌𝑓𝑜𝑢 𝑍 6, 𝐺 + 𝑌𝑓𝑜𝑢(𝑍 9, 𝐽𝑍)
𝑌0 𝑌1 𝑌2 /B/ 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3 Div Div Div /F/ /IY/ 𝑍
2
𝑍
6
𝑍
9
23
/IY/ Div 𝑍
4
𝐸𝐽𝑊 = 𝑌𝑓𝑜𝑢 𝑍
2, 𝐶 + 𝑌𝑓𝑜𝑢 𝑍 4, 𝐽𝑍 + 𝑌𝑓𝑜𝑢 𝑍 6, 𝐺 + 𝑌𝑓𝑜𝑢(𝑍 9, 𝐽𝑍)
𝐸𝐽𝑊 =
𝑢
𝑌𝑓𝑜𝑢 𝑍
𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢 = − 𝑢
log 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑌0 𝑌1 𝑌2 /B/ 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3 Div Div Div /F/ /IY/ 𝑍
2
𝑍
6
𝑍
9
Div Div Div Div Div Div Div
24
/IY/ 𝑍
4
𝐸𝐽𝑊 =
𝑢
𝑌𝑓𝑜𝑢 𝑍
𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢 = − 𝑢
log 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑢
𝛼𝑍
𝑢𝐸𝐽𝑊 = 0
… −1 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢 …
– Zeros except at the component corresponding to the target
𝑌0 𝑌1 𝑌2 /B/ 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3 Div Div Div /F/ /IY/ 𝑍
2
𝑍
6
𝑍
9
Div Div Div Div Div Div Div
25
/IY/ 𝑍
4
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
𝑢
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
26
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
– Either randomly, based on some heuristic, or any other rationale
– Train the network using the current alignment – Reestimate the alignment for each training instance
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
27
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
– Either randomly, based on some heuristic, or any other rationale
– Train the network using the current alignment – Reestimate the alignment for each training instance
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
28
– The unaligned 𝐿-length symbol sequence 𝑇 = 𝑇0 … 𝑇𝐿−1 (e.g. /B/ /IY/ /F/ /IY/) – An 𝑂-length input (𝑂 ≥ 𝐿) – And a (trained) recurrent network
– An 𝑂-length expansion 𝑡0 … 𝑡𝑂−1 comprising the symbols in S in strict
– i.e.𝑡0 = 𝑇0, 𝑡2 = 𝑇1, 𝑇3 = 𝑇1, 𝑡4 = 𝑇2, 𝑡5 = 𝑇3, … 𝑡𝑂−1 = 𝑇𝐿−1
– 𝑡𝑗 = 𝑇𝑙 ⇒ 𝑗 ≥ 𝑙 – 𝑡𝑗 = 𝑇𝑙, 𝑡
𝑘= 𝑇𝑚,
𝑗 < 𝑘 ⇒ 𝑙 ≤ 𝑚
the input 𝑌0 … 𝑌𝑂−1
29
30
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3 /AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
– (Conditioned on input 𝑌0 … 𝑌𝑂−1)
sequence
– E.g. the unconstrained decode may be /AH//AH//AH//D//D//AH//F//IY//IY/
– Whereas we want an expansion of /B//IY//F//IY/
31
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
32
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/ 𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
33
Compute the entire output (for all symbols) Copy the output values for the target symbols into the secondary reduced structure
34
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/ 𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
35
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/ 𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
36
Arrange the constructed table so that from top to bottom it has the exact sequence of symbols required
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/
37
Arrange the constructed table so that from top to bottom it has the exact sequence of symbols required
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/
– I.e. never goes up
– /B/ /IY/ /F/ /IY/ in this case
38
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/
39
/IY/ /B/ /F/ /IY/
valid alignment
– Which maps on to the target symbol sequence (/B//AH//T/)
algorithm
– E.g. The Viterbi algorithm
𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
40
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑇(𝑠) is the probability of the target symbol assigned to the 𝑠-th row
in the 𝑢-th time (given inputs 𝑌0 … 𝑌𝑢)
– E.g., S(0) = /B/
𝐶
– E.g. S(1) = S(3) = /IY/
𝐽𝑍
– E.g. S(2) = /F/
𝐺 41
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄(𝑢, 0) = 0, 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 0 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 42
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 43
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 44
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 45
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 46
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 47
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 48
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 49
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 50
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐶𝑄 0, 𝑗 = 𝑜𝑣𝑚𝑚, 𝑗 = 0 … 𝐿 − 1
𝐶𝑡𝑑𝑠 0,0 = 𝑧0
𝑇 0 , 𝐶𝑡𝑑𝑠 0, 𝑗 = −∞, 𝑗 = 1 … 𝐿 − 1
𝐶𝑄 𝑢, 0 = 0; 𝐶𝑡𝑑𝑠(𝑢, 0) = 𝐶𝑡𝑑𝑠(𝑢 − 1,0) × 𝑧𝑢
𝑇 0
for 𝑚 = 1 … 𝐿 − 1
𝑚 − 1; 𝑓𝑚𝑡𝑓 𝑚
𝑇 𝑚 51
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
52
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
53
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
54
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 =
𝑢
𝑌𝑓𝑜𝑢 𝑍
𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢 𝑐𝑓𝑡𝑢𝑞𝑏𝑢ℎ = − 𝑢
log 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑐𝑓𝑡𝑢𝑞𝑏𝑢ℎ
𝑢
𝛼𝑍
𝑢𝐸𝐽𝑊 = 0
… −1 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑐𝑓𝑡𝑢𝑞𝑏𝑢ℎ
…
– Zeros except at the component corresponding to the target in the estimated alignment
55
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
56
Decode to obtain alignments Train model with given alignments Initialize alignments The “decode” and “train” steps may be combine into a single “decode, find alignment, compute derivatives” step for SGD and mini-batch updates
57
58
– The most likely alignment
𝐸𝐽𝑊 = −
𝑢
log 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑐𝑓𝑡𝑢𝑞𝑏𝑢ℎ
– This can be way off, particularly in early iterations, or if the model is poorly initialized
– Selecting a single alignment is the same as drawing a single sample from this distribution – Selecting the most likely alignment is the same as deterministically always drawing the most probable value from the distribution
59
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
– The most likely alignment
𝐸𝐽𝑊 = −
𝑢
log 𝑍 𝑢, 𝑡𝑧𝑛𝑐𝑝𝑚𝑢
𝑐𝑓𝑡𝑢𝑞𝑏𝑢ℎ
– This can be way off, particularly in early iterations, or if the model is poorly initialized
Symbol sequence (to the input)
– Selecting a single alignment is the same as drawing a single sample from it – Selecting the most likely alignment is the same as deterministically always drawing the most probable value from the distribution
60
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑢
61
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = 𝐹 −
𝑢
log 𝑍 𝑢, 𝑡𝑢
𝐸𝐽𝑊 = −
𝑢
𝐹 log 𝑍 𝑢, 𝑡𝑢
– This reduces to finding the expected divergence at each input
𝐸𝐽𝑊 = −
𝑢
𝑇∈𝑇1…𝑇𝐿
𝑄(𝑡𝑢 = 𝑇|𝐓, 𝐘) log 𝑍 𝑢, 𝑡𝑢 = 𝑡
62
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = 𝐹 −
𝑢
log 𝑍 𝑢, 𝑡𝑢
𝐸𝐽𝑊 = −
𝑢
𝐹 log 𝑍 𝑢, 𝑡𝑢
– This reduces to finding the expected divergence at each input
𝐸𝐽𝑊 = −
𝑢
𝑇∈𝑇1…𝑇𝐿
𝑄(𝑡𝑢 = 𝑇|𝐓, 𝐘) log 𝑍 𝑢, 𝑡𝑢 = 𝑇
63
t 1 2 3 4 5 6 7 8
/IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
64
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝑡𝑢+1 … 𝑡𝑂−1, 𝐓 𝐘
=
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝑡𝑢+1 … 𝑡𝑂−1 𝐘
– Because the target symbol sequence 𝐓 is implicit in the synchronized sequences 𝑡0 … 𝑡𝑂−1which are constrained to be expansions of 𝐓
65
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝐘
assumption: 𝑄 𝑡𝑢+1 … 𝑡0 … 𝑡𝑢, 𝐘 = 𝑄 𝑡𝑢+1 … 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝑡𝑢 = 𝑇𝑠, 𝐘
66
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠, 𝐘
assumption: 𝑄 𝑡𝑢+1 … 𝑡0 … 𝑡𝑢, 𝐘 = 𝑄 𝑡𝑢+1 … 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝑡𝑢 = 𝑇𝑠, 𝐘
67
Note: in reality, this assumption is not valid if the hidden states are unknown, but we will make it anyway
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
variables 𝐈 = 𝐼0 𝐼1 … 𝐼𝑂−1
conditionally independent given 𝐘
– This wouldn’t be true if the relation between 𝐘 and 𝐈 were not deterministic or if 𝐘 is unknown
68
𝐘 = 𝑌0 𝑌1… 𝑌𝑂−1 𝐈 = 𝐼0 𝐼1 … 𝐼𝑂−1 𝑧0 𝑧1 𝑧𝑂−1 ⋮
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘
69
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘
70
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘
71
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 𝑢, 𝑠 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝑡0 … 𝑡𝑢−1, 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−2→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠 𝐘 +
𝑡0…𝑡𝑢−2→𝑇1…[𝑇(𝑠−1)−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘
72
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 𝑢, 𝑠 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝑡0 … 𝑡𝑢−1, 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−2→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠 𝐘 +
𝑡0…𝑡𝑢−2→𝑇1…[𝑇(𝑠−1)−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘
73
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 𝑢, 𝑠 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝑡0 … 𝑡𝑢−1, 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−2→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠 𝐘 +
𝑡0…𝑡𝑢−2→𝑇1…[𝑇(𝑠−1)−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘
74
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 𝑢, 𝑠 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝑡0 … 𝑡𝑢−1, 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−2→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠 𝐘 +
𝑡0…𝑡𝑢−2→𝑇1…[𝑇(𝑠−1)−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘
75
𝛽 𝑢 − 1, 𝑠 𝛽 𝑢 − 1, 𝑠 − 1 𝑧𝑢
𝑇(𝑠)
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 𝑢, 𝑠 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝑡0 … 𝑡𝑢−1, 𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 =
𝑡0…𝑡𝑢−2→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠 𝐘 +
𝑡0…𝑡𝑢−2→𝑇1…[𝑇(𝑠−1)−]
𝑄 𝑡0 … 𝑡𝑢−2, 𝑡𝑢−1 = 𝑇𝑠−1 𝐘 𝑄 𝑡𝑢 = 𝑇𝑠 𝐘 𝛽 𝑢, 𝑠 = 𝛽 𝑢 − 1, 𝑠 + 𝛽 𝑢 − 1, 𝑠 − 1 𝑧𝑢
𝑇(𝑠)
76
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
77
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 78
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 79
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 80
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 81
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 82
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛽 0,1 = 𝑧0
𝑇 1 ,
𝛽 0, 𝑠 = 0, 𝑠 > 1
𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1)𝑧𝑢
𝑇 1
for 𝑚 = 2 … 𝐿
𝑇 𝑚 83
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑇 𝑚
𝑇 𝑚
84
ො 𝛽 0,1 = 1, ො 𝛽 0, 𝑠 = 0, 𝑠 > 1 𝛽 0, 𝑠 = ො 𝛽 0, 𝑠 𝑧0
𝑇 𝑠 ,
1 ≤ 𝑠 ≤ 𝐿
ො 𝛽(𝑢, 1) = 𝛽(𝑢 − 1,1) for 𝑚 = 2 … 𝐿
𝛽(𝑢, 𝑚) = 𝛽 𝑢 − 1, 𝑚 + 𝛽 𝑢 − 1, 𝑚 − 1
𝛽 𝑢, 𝑠 = ො 𝛽 𝑢, 𝑠 𝑧𝑢
𝑇 𝑠 ,
1 ≤ 𝑠 ≤ 𝐿
85
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 =
𝑡0…𝑡𝑢−1→𝑇1…[𝑇𝑠−]
𝑄 𝑡0 … 𝑡𝑢−1, 𝑡𝑢 = 𝑇𝑠 𝐘
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘
86
We have seen how to compute this 𝛽 𝑢, 𝑠 t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
87
We have seen how to compute this t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
88
Lets look at this 𝛾 𝑢, 𝑠 t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾 𝑢, 𝑠 =
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 +
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠+1, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘
89
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾 𝑢, 𝑠 =
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 +
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠+1, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 = 𝑄 𝑡𝑢+1 = 𝑇𝑠 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠, 𝐘 + 𝑄 𝑡𝑢+1 = 𝑇𝑠+1 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠+1, 𝐘
90
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾 𝑢, 𝑠 =
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 +
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠+1, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 = 𝑄 𝑡𝑢+1 = 𝑇𝑠 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠, 𝐘 + 𝑄 𝑡𝑢+1 = 𝑇𝑠+1 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠+1, 𝐘 = 𝑄 𝑡𝑢+1 = 𝑇𝑠 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 + 𝑄 𝑡𝑢+1 = 𝑇𝑠+1 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝐘
91
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾 𝑢, 𝑠 =
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 … 𝑡𝑂−1 𝐘 =
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 +
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+1 = 𝑇𝑠+1, 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 = 𝑄 𝑡𝑢+1 = 𝑇𝑠 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠, 𝐘 + 𝑄 𝑡𝑢+1 = 𝑇𝑠+1 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝑡𝑢+1 = 𝑇𝑠+1, 𝐘 = 𝑄 𝑡𝑢+1 = 𝑇𝑠 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝐘 + 𝑄 𝑡𝑢+1 = 𝑇𝑠+1 𝐘
𝑡𝑢+2…𝑡𝑂−1→[𝑇(𝑠+1)+]…𝑇𝐿
𝑄 𝑡𝑢+2 … 𝑡𝑂−1 𝐘
92
𝛾 𝑢 + 1, 𝑠 𝑧𝑢+1
𝑇(𝑠+1)
𝑧𝑢+1
𝑇(𝑠)
𝛾 𝑢 + 1, 𝑠 + 1 t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑇(𝑠)𝛾 𝑢 + 1, 𝑠
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
93
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾(𝑢, 𝐿) = 𝛾(𝑢 + 1, 𝐿)𝑧𝑢+1
𝑇 𝐿
for 𝑚 = 𝐿 − 1 … 1
𝑇(𝑚)𝛾 𝑢 + 1, 𝑠
+ 𝑧𝑢+1
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
94
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾(𝑢, 𝐿) = 𝛾(𝑢 + 1, 𝐿)𝑧𝑢+1
𝑇 𝐿
for 𝑚 = 𝐿 − 1 … 1
𝑇(𝑚)𝛾 𝑢 + 1, 𝑠
+ 𝑧𝑢+1
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
95
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾(𝑢, 𝐿) = 𝛾(𝑢 + 1, 𝐿)𝑧𝑢+1
𝑇 𝐿
for 𝑚 = 𝐿 − 1 … 1
𝑇(𝑚)𝛾 𝑢 + 1, 𝑠
+ 𝑧𝑢+1
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
96
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾(𝑢, 𝐿) = 𝛾(𝑢 + 1, 𝐿)𝑧𝑢+1
𝑇 𝐿
for 𝑚 = 𝐿 − 1 … 1
𝑇(𝑚)𝛾 𝑢 + 1, 𝑠
+ 𝑧𝑢+1
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
97
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝛾(𝑢, 𝐿) = 𝛾(𝑢 + 1, 𝐿)𝑧𝑢+1
𝑇 𝐿
for 𝑚 = 𝐿 − 1 … 1
𝑇(𝑚)𝛾 𝑢 + 1, 𝑠
+ 𝑧𝑢+1
𝑇(𝑠+1)𝛾 𝑢 + 1, 𝑠 + 1
98
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑡𝑢+1…𝑡𝑂−1→[𝑇𝑠+]…𝑇𝐿
99
We now can compute this 𝛾 𝑢, 𝑠 t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
100
Backward algo Forward algo t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 = 𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠
𝑄 𝑡𝑢 = 𝑇𝑠|𝐓, 𝐘 = 𝑄 𝑡𝑢 = 𝑇𝑠, 𝐓|𝐘 σ𝑇𝑠
′ 𝑄 𝑡𝑢 = 𝑇𝑠
′, 𝐓|𝐘 =
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′
𝑄 𝑡𝑢 = 𝑇𝑠|𝐓, 𝐘 = ො 𝛽 𝑢, 𝑠 𝑧𝑢
𝑇(𝑠)𝛾 𝑢, 𝑠
ො 𝛽 𝑢, 𝑠 𝑧𝑢
𝑇(𝑠)𝛾 𝑢, 𝑠 + σ𝑠′≠𝑠 𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠′
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = −
𝑢
𝑡∈𝑇1…𝑇𝐿
𝑄 𝑡𝑢 = 𝑡 𝐓, 𝐘 log 𝑍 𝑢, 𝑡𝑢 = 𝑡 𝐸𝐽𝑊 = −
𝑢
𝑠
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′ log 𝑧𝑢
𝑇(𝑠)
𝛼𝑍
𝑢𝐸𝐽𝑊 = 𝑒𝐸𝐽𝑊
𝑒𝑧𝑢
1
𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
2
… 𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
𝑀
– Components will be non-zero only for symbols that occur in the training instance
102
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = −
𝑢
𝑡∈𝑇1…𝑇𝐿
𝑄 𝑡𝑢 = 𝑡 𝐓, 𝐘 log 𝑍 𝑢, 𝑡𝑢 = 𝑡 𝐸𝐽𝑊 = −
𝑢
𝑠
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′ log 𝑧𝑢
𝑇(𝑠)
𝛼𝑍
𝑢𝐸𝐽𝑊 = 𝑒𝐸𝐽𝑊
𝑒𝑧𝑢
1
𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
2
… 𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
𝑀
– Components will be non-zero only for symbols that occur in the training instance
103
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = −
𝑢
𝑡∈𝑇1…𝑇𝐿
𝑄 𝑡𝑢 = 𝑡 𝐓, 𝐘 log 𝑍 𝑢, 𝑡𝑢 = 𝑡 𝐸𝐽𝑊 = −
𝑢
𝑠
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′ log 𝑧𝑢
𝑇(𝑠)
𝛼𝑍
𝑢𝐸𝐽𝑊 = 𝑒𝐸𝐽𝑊
𝑒𝑧𝑢
1
𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
2
… 𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
𝑀
– Components will be non-zero only for symbols that occur in the training instance
104
Must compute these terms from here t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝐸𝐽𝑊 = −
𝑢
𝑠
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′ log 𝑧𝑢
𝑇(𝑠)
all instances of that symbol in the target sequence 𝑒𝐸𝐽𝑊 𝑒𝑧𝑢
𝑚 = −
𝑠 ∶𝑇 𝑠 =𝑚
𝑒 𝑒𝑧𝑢
𝑇(𝑠)
𝛽 𝑢, 𝑠 𝛾 𝑢, 𝑠 σ𝑠′ 𝛽 𝑢, 𝑠′ 𝛾 𝑢, 𝑠′ log 𝑧𝑢
𝑇(𝑠)
– E.g. the derivative w.r.t 𝑧𝑢
5 will sum over both rows representing /IY/ in the above figure
105
The derivatives at both these locations must be summed to get 𝑒𝐸𝐽𝑊
𝑒𝑧4
5
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
106
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
107
108
/B/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ 𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/F/
109
𝑢𝐸𝐽𝑊
𝑢
110
t 1 2 3 4 5 6 7 8 /IY/ /B/ /F/ /IY/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑢𝐸𝐽𝑊 for each 𝑍
𝑢
𝑢𝐸𝐽𝑊 = 𝑒𝐸𝐽𝑊
1
2
𝑀
𝑚 = −
𝑠 ∶𝑇 𝑠 =𝑚
𝑇(𝑠)
𝑇(𝑠)
111
112
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌3
113
/AH/ /B/ /D/ /EH/ /IY/ /F/ /G/ 𝑧0
𝐵𝐼
𝑧0
𝐶
𝑧0
𝐸
𝑧0
𝐹𝐼
𝑧0
𝐽𝑍
𝑧0
𝐺
𝑧0
𝐻
𝑧1
𝐵𝐼
𝑧1
𝐶
𝑧1
𝐸
𝑧1
𝐹𝐼
𝑧1
𝐽𝑍
𝑧1
𝐺
𝑧1
𝐻
𝑧2
𝐵𝐼
𝑧2
𝐶
𝑧2
𝐸
𝑧2
𝐹𝐼
𝑧2
𝐽𝑍
𝑧2
𝐺
𝑧2
𝐻
𝑧3
𝐵𝐼
𝑧3
𝐶
𝑧3
𝐸
𝑧3
𝐹𝐼
𝑧3
𝐽𝑍
𝑧3
𝐺
𝑧3
𝐻
𝑧4
𝐵𝐼
𝑧4
𝐶
𝑧4
𝐸
𝑧4
𝐹𝐼
𝑧4
𝐽𝑍
𝑧4
𝐺
𝑧4
𝐻
𝑧5
𝐵𝐼
𝑧5
𝐶
𝑧5
𝐸
𝑧5
𝐹𝐼
𝑧5
𝐽𝑍
𝑧5
𝐺
𝑧5
𝐻
𝑧6
𝐵𝐼
𝑧6
𝐶
𝑧6
𝐸
𝑧6
𝐹𝐼
𝑧6
𝐽𝑍
𝑧6
𝐺
𝑧6
𝐻
𝑧7
𝐵𝐼
𝑧7
𝐶
𝑧7
𝐸
𝑧7
𝐹𝐼
𝑧7
𝐽𝑍
𝑧7
𝐺
𝑧7
𝐻
𝑧8
𝐵𝐼
𝑧8
𝐶
𝑧8
𝐸
𝑧8
𝐹𝐼
𝑧8
𝐽𝑍
𝑧8
𝐺
𝑧8
𝐻
/G/ /F/ /IY/ /D/ Cannot distinguish between an extended symbol and repetitions of the symbol /F/
114
discrete versions of a symbol
– A “blank” (represented by “-”) – RRR---OO---DDD = ROD – RR-R---OO---D-DD = RRODD – R-R-R---O-ODD-DDDD-D = RRROODDD
blank symbol
– Which too must be trained
115
116
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
–
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
–
117
/B/ /IY/ /F/ /IY/
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
–
118
/B/ /IY/ /F/ /IY/
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
–
119
/B/ /IY/ /F/ /F/ /IY/
120
t 1 2 3 4 5 6 7 8 /IY/ /B/ /IY/ /F/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
/IY/ /B/ /IY/
121
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– /F/ 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ /B/ /F/ /IY/
122
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
/IY/ /B/ /F/ /IY/ 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
123
/IY/ /B/ /F/ /IY/ 𝑧6
5
124
required between distinct symbols
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝑐, 𝛽 0,1 = 𝑧0 𝑐, 𝛽 0, 𝑠 = 0
125
/IY/ /B/ /F/ /IY/ 𝑧0
5
𝑧0
5
𝑧0
6
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– t 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝛽 𝑢, 𝑠 = 𝛽 𝑢 − 1, 𝑠 + 𝛽 𝑢 − 1, 𝑠 − 1 𝑧𝑢
𝑇(𝑠)
𝛽 𝑢, 𝑠 = 𝛽 𝑢 − 1, 𝑠 + 𝛽 𝑢 − 1, 𝑠 − 1 + 𝛽 𝑢 − 1, 𝑠 − 2 𝑧𝑢
𝑇(𝑠)
126
/IY/ /B/ /F/ /IY/ 𝑧0
5
𝑧0
5
𝑧0
6
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– t 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝛽 𝑢, 𝑠 = 𝛽 𝑢 − 1, 𝑠 + 𝛽 𝑢 − 1, 𝑠 − 1 𝑧𝑢
𝑇(𝑠)
𝛽 𝑢, 𝑠 = 𝛽 𝑢 − 1, 𝑠 + 𝛽 𝑢 − 1, 𝑠 − 1 + 𝛽 𝑢 − 1, 𝑠 − 2 𝑧𝑢
𝑇(𝑠)
127
/IY/ /B/ /F/ /IY/ 𝑧0
5
𝑧0
5
𝑧0
6
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– t 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
128
/IY/ /B/ /F/ /IY/ 𝑧8
2
𝑧8
5
𝑧8
5
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– t 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
𝛾 𝑢, 𝑠 = 𝛾 𝑢 + 1, 𝑠 𝑧𝑢
𝑇(𝑠) + 𝛾 𝑢 + 1, 𝑠 + 1 𝑧𝑢 𝑇(𝑠+1)
𝛾 𝑢, 𝑠 = 𝛾 𝑢 + 1, 𝑠 𝑧𝑢
𝑇(𝑠) + 𝛾 𝑢 + 1, 𝑠 + 1 𝑧𝑢 𝑇(𝑠+1) + 𝛾 𝑢 + 1, 𝑠 + 2 𝑧𝑢 𝑇(𝑠+2)
129
/IY/ /B/ /F/ /IY/ 𝑧8
2
𝑧8
5
𝑧8
5
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– 𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
– t 𝑧0
𝐶
𝑧1
𝐶
𝑧2
𝐶
𝑧3
𝐶
𝑧4
𝐶
𝑧5
𝐶
𝑧6
𝐶
𝑧7
𝐶
𝑧8
𝐶
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐽𝑍
𝑧1
𝐽𝑍
𝑧2
𝐽𝑍
𝑧3
𝐽𝑍
𝑧4
𝐽𝑍
𝑧5
𝐽𝑍
𝑧6
𝐽𝑍
𝑧7
𝐽𝑍
𝑧8
𝐽𝑍
𝑧0
𝐺
𝑧1
𝐺
𝑧2
𝐺
𝑧3
𝐺
𝑧4
𝐺
𝑧5
𝐺
𝑧6
𝐺
𝑧7
𝐺
𝑧8
𝐺
130
𝑌0 𝑌1 𝑌2 𝑌4 𝑌5 𝑌6 𝑌7 𝑌8 𝑌9 𝑌3
𝑍 𝑍
1
𝑍
2
𝑍
4
𝑍
5
𝑍
6
𝑍
7
𝑍
8
𝑍
9
𝑍
3
131
132
𝑧0
𝑐
𝑧1
𝑐
𝑧2
𝑐
𝑧3
𝑐
𝑧4
𝑐
𝑧5
𝑐
𝑧6
𝑐
𝑧7
𝑐
𝑧8
𝑐
–
133
𝑢𝐸𝐽𝑊 for each 𝑍
𝑢
134
𝑢𝐸𝐽𝑊 for each 𝑍
𝑢
𝑢𝐸𝐽𝑊 = 𝑒𝐸𝐽𝑊
1
2
𝑀
𝑚 = −
𝑠 ∶𝑇 𝑠 =𝑚
𝑇(𝑠)
𝑇(𝑠)
135
136
– Symbols partitioned into two or more sequential subunits
– Symbol-specific blanks
– CTC can use bidirectional recurrent nets
– Other variants possible..
137
138
Time 𝑄
1
X(t) t=0 𝑄2 𝑄3 𝑄
4
𝑄5 𝑄6 𝑄7
139
Time 𝑋
1
X(t) t=0 𝑋
2
140
141