Multimodal Machine Translation
Lucia Specia
University of Sheffield l.specia@sheffield.ac.uk
Multi MT
MTM - Lisbon, 1 Sept 2017
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 1 / 72
Multi MT MTM - Lisbon, 1 Sept 2017 Lucia Specia (USFD) MMT MTM - - - PowerPoint PPT Presentation
Multimodal Machine Translation Lucia Specia University of Sheffield l.specia@sheffield.ac.uk Multi MT MTM - Lisbon, 1 Sept 2017 Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 1 / 72 A wall divided the city. Lucia Specia (USFD) MMT MTM
University of Sheffield l.specia@sheffield.ac.uk
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 1 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 2 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 2 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 2 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 2 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 2 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 3 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 4 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 5 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 6 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 7 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 7 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 7 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 8 / 72
Image from (Elliott et al., ACL16) tutorial on Multimodal Learning and Reasoning
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 9 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 10 / 72
Images from (Elliott et al., ACL16) tutorial on Multimodal Learning and Reasoning
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 10 / 72
Images from (Elliott et al., ACL16) tutorial on Multimodal Learning and Reasoning
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 11 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 12 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 13 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 13 / 72
Images from (Elliott et al., ACL16) tutorial on Multimodal Learning and Reasoning
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 13 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 14 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 14 / 72
Images from (Elliott et al., ACL16) tutorial on Multimodal Learning and Reasoning
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 14 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 15 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 16 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 17 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 18 / 72
1 Object detection is not perfect and strongly biased towards objects
2 Mapping models only work well enough in closed domains 3 No obvious way to encode sparse image information along with
4 No large enough multimodal dataset to train translation models Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 19 / 72
1 Object detection is not perfect and strongly biased towards objects
2 Mapping models only work well enough in closed domains 3 No obvious way to encode sparse image information along with
4 No large enough multimodal dataset to train translation models
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 19 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 20 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 21 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 22 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 23 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 24 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 25 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 26 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 27 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 28 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 29 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 29 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 30 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 30 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 31 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 32 / 72
1http://www.statmt.org/wmt17/ Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 33 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 34 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 34 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 34 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 35 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 36 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 37 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 38 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 39 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 40 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 41 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 42 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 43 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 44 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 45 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 46 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 47 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 48 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 49 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 49 / 72
similar similar similar similar not similar partially similar
2Joint work with Josiah Wang Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 50 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 51 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 52 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 53 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 54 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 55 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 56 / 72
3Joint work with Pranava Madhyastha and Josiah Wang Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 57 / 72
1 Initialising the encoder (InitEnc): images as the first token 2 Initialising decoder (InitDec): initialise the decoder’s first hidden
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 58 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 59 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 59 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 59 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 60 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 61 / 72
SRC: Three children in football uniforms of two different teams are playing football on a football field, while another player and an adult stand in the background. TXT: Drei Kinder in Fußballtrikots zweier verschiedener Mannschaften spielen Fußball auf einem Fußballplatz w¨ ahrend ein weiterer Spieler und eine Erwachsener im Hintergrund stehen. IMG: Drei Kinder in Footballtrikots zweier verschiedener Mannschaften spielen Football auf einem Footballplatz w¨ ahrend ein weiterer Spieler und ein Erwachsener im Hintergrund stehen.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 62 / 72
MT: Drei Kinder in Trikots spielen Fußball auf einem Fußballfeld, w¨ ahrend ein anderer Spieler im Hintergrund stehen. MMT: Drei Kinder in Trikots spielen Fußball auf einem Footballfeld, w¨ ahrend ein anderer Spieler und ein Erwachsener im Hintergrund spielen.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 62 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 63 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 63 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 64 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 64 / 72
SRC: A woman sitting on a very large rock smiling at the camera with trees in the background. TXT: Eine Frau sitzt vor B¨ aumen im Hintergrund auf einem sehr großen Felsen und l¨ achelt in die Kamera. IMG: Eine Frau sitzt vor B¨ aumen im Hintergrund auf einem sehr großen Stein und l¨ achelt in die Kamera.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 65 / 72
MT: Eine Frau sitzt auf einem sehr großen Stein, l¨ achelt in die Kamera mit B¨ aumen im Hintergrund. MMT: Eine Frau sitzt auf einem sehr großen Felsen in die Kamera mit B¨ aumen im Hintergrund.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 65 / 72
1
2
3
4
5
6
7
8
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 66 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 67 / 72
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 68 / 72
University of Sheffield l.specia@sheffield.ac.uk
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 69 / 72
Deena, S., Ng, R. W., Madhyashta, P., Specia, L., and Hain, T. (2017). Semi-supervised adaptation of rnnlms by fine-tuning with domain-specific auxiliary features. In Conference of the International Speech Communication Association, Stockholm, Sweden. Elliott, D., Frank, S., Barrault, L., Bougares, F., and Specia, L. (2017). Findings of the second shared task on multimodal machine translation and multilingual image description. In Proceedings of the Second Conference on Machine Translation, Volume 2: Shared Tasks Papers, Copenhagen, Denmark. Association for Computational Linguistics. Elliott, D., Frank, S., and Hasler, E. (2015). Multi-language image description with neural sequence models. CoRR, abs/1510.04709.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 70 / 72
Elliott, D., Frank, S., Sima’an, K., and Specia, L. (2016). Multi30k: Multilingual english-german image descriptions. In 5th Workshop on Vision and Language, pages 70–74, Berlin, Germany. Gella, S., Lapata, M., and Keller, F. (2016). Unsupervised visual sense disambiguation for verbs using multimodal embeddings. In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 182–192, San Diego, California. Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang, Z., Karpathy, A., Khosla, A., Bernstein, M., Berg, A. C., and Fei-Fei, L. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision (IJCV), 115(3):211–252. Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang, Z., Karpathy, A., Khosla, A., Bernstein, M. S., Berg, A. C., and Li, F. (2014). Imagenet large scale visual recognition challenge. CoRR, abs/1409.0575.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 71 / 72
Xu, K., Ba, J., Kiros, R., Cho, K., Courville, A. C., Salakhutdinov, R., Zemel,
Show, attend and tell: Neural image caption generation with visual attention. In ICML, volume 14, pages 77–81.
Lucia Specia (USFD) MMT MTM - Lisbon, 1 Sept 2017 72 / 72