Algorithms for NLP CS 11-711 Fall 2020 Lecture 8: Viterbi, - PowerPoint PPT Presentation

Algorithms for NLP CS 11-711 · Fall 2020 Lecture 8: Viterbi, discriminative sequence labeling, NER Emma Strubell

Announcements ■ Project 1 is due tomorrow! You may submit up to 3 days late (out of a budget of 5 total for the semester). ■ No recitation tomorrow (Friday). Do your homework. 2

Recap Hidden Markov models (HMMs) Q = q 1 q 2 ... q N a set of N states A = a 11 ... a ij ... a NN a transition probability matrix A , each a i j representing the probability of moving from state i to state j , s.t. P N j = 1 a i j = 1 ∀ i O = o 1 o 2 ... o T a sequence of T observations , each one drawn from a vocabulary V = v 1 , v 2 ,..., v V B = b i ( o t ) a sequence of observation likelihoods , also called emission probabili- ties , each expressing the probability of an observation o t being generated from a state q i π = π 1 , π 2 ,..., π N an initial probability distribution over states. π i is the probability that the Markov chain will start in state i . Some states j may have π j = 0, meaning that they cannot be initial states. Also, P n i = 1 π i = 1 4

Recap Hidden Markov models (HMMs) Forward Viterbi Forward-backward; Baum-Welch 5

<latexit sha1_base64="kj8oX+bvtC3juVL/nWM6fABUd8=">ADvHicfVJb9MwFPYaLqNc1sEjL4Zq0kCoagoSvIAm4IEXRJHoNqkuleOcpFZ9iWynWxXlf/BreIW/wL/BScq0rBNHivPp8zk+37lEmeDWDYd/djrBjZu3bu/e6d69d/BXm/4bHVuWEwYVpocxpRC4IrmDjuBJxmBqiMBJxEyw/V/ckKjOVafXPrDGaSponFHnqXlv1CUL6gpXzsPvCr/FhJpU0vN54SqixOPDGmAieYzPKvhs3usPB8Pa8DYIN6CPNjae73cMiTXLJSjHBLV2Gg4zNyuocZwJKLskt5BRtqQpTD1UVIKdFXVxJT7wTIwTbfynHK7ZyxEFldauZeQ9JXULe/WuIq+7m+YueTMruMpyB4o1iZJcYKdx1SkcwPMibUHlBnutWK2oIYy5/vZPbicZgFiBa5dCJOzwiZ19pakSJbt4POm0C4xoOCMaSmpip8XJKGSi3UMCc2FKwtik3/4un69iFc8s5vWXTwpwBFteMoVFQISR6qjTfvfwpH67JKP4Adk4LNX/SUDQ502XkmzE6UfWEqekAr+z5OrC08P2UVtQBfTNUXnYEqyhoyoS2QKDU6z1qCt+Jrof4BmvgxNP7QDms8/JaGV3dyGxyPBuHLwejrq/7R+82+7qLH6Ck6RCF6jY7QJzRGE8TQD/QT/UK/g3dBHCwD2bh2djYxj1DLgtVfxFEqg=</latexit> HMM tagging as decoding ■ Decoding : Given as input an HMM λ = (A, B) and sequence of observations O = o 1 , o 2 , …, o n , find the most probable sequence of states Q = q 1 , q 2 , …, q n ˆ t n P ( t n 1 | w n 1 = argmax 1 ) t n 1 … q 1 q 2 q n o 1 o 2 o n 6

<latexit sha1_base64="9BSv32hbIdli0R5g8Y34vtwAIU=">AD+3icfVJNb9NAEN0k0Bbz0RSOXBaiSglCUVKQ4IJUAQcuiCRtlI2ROv1OFl1P8zuOm1k+dwQ1z5LYgfg8TaTqu6qRjJ6eZN7szbyZMBLduMPjTaLZu3d7a3rkT3L13/8Fue+/hkdWpYTBmWmhzElILgisYO+4EnCQGqAwFHIen74r48RKM5Vp9casEpLOFY85o867Zu1vwT5ZUJe5fDb8qvAbTKiZS3o+y1zhyPGoWwJMJI/wWQF7wSaLxIaybNQtCSW1DPTW2b38ItbLZ+3OoD8oDW+C4Rp0NpGs72mIZFmqQTlmKDWToaDxE0zahxnAvKApBYSyk7pHCYeKirBTrNSmxzve0+EY238pxwuvVczMiqtXcnQMyV1C3s9Vjhvik1SF7+eZlwlqQPFqofiVGCncSE0jrgB5sTKA8oM97VitqBeJufH4VW/8swCxBJcvREmp5mNy9drJYUyryefV40GxICM6alpCp6lpGYSi5WEcQ0FS7PiI0v8E16PY+WPLFr6S6vFOCINnzOFRUCYkeKo+72v4Uj5RmQ9+AHZOCjr/pTAoY6bXwl1a7kfmBz8oQU8H9Mri6ZHtbysoCfDOFLjoBleUlZEJbIOHc6DSpFbyRXxbqL6CxH0PFh3paxfBbOry+k5vg6KA/fNE/+Pyc/h2va876DF6irpoiF6hQ/QBjdAYMfQb/W1sNbZbet760frZ0VtNtY5j1DNWr/+AWJYWpg=</latexit> <latexit sha1_base64="kj8oX+bvtC3juVL/nWM6fABUd8=">ADvHicfVJb9MwFPYaLqNc1sEjL4Zq0kCoagoSvIAm4IEXRJHoNqkuleOcpFZ9iWynWxXlf/BreIW/wL/BScq0rBNHivPp8zk+37lEmeDWDYd/djrBjZu3bu/e6d69d/BXm/4bHVuWEwYVpocxpRC4IrmDjuBJxmBqiMBJxEyw/V/ckKjOVafXPrDGaSponFHnqXlv1CUL6gpXzsPvCr/FhJpU0vN54SqixOPDGmAieYzPKvhs3usPB8Pa8DYIN6CPNjae73cMiTXLJSjHBLV2Gg4zNyuocZwJKLskt5BRtqQpTD1UVIKdFXVxJT7wTIwTbfynHK7ZyxEFldauZeQ9JXULe/WuIq+7m+YueTMruMpyB4o1iZJcYKdx1SkcwPMibUHlBnutWK2oIYy5/vZPbicZgFiBa5dCJOzwiZ19pakSJbt4POm0C4xoOCMaSmpip8XJKGSi3UMCc2FKwtik3/4un69iFc8s5vWXTwpwBFteMoVFQISR6qjTfvfwpH67JKP4Adk4LNX/SUDQ502XkmzE6UfWEqekAr+z5OrC08P2UVtQBfTNUXnYEqyhoyoS2QKDU6z1qCt+Jrof4BmvgxNP7QDms8/JaGV3dyGxyPBuHLwejrq/7R+82+7qLH6Ck6RCF6jY7QJzRGE8TQD/QT/UK/g3dBHCwD2bh2djYxj1DLgtVfxFEqg=</latexit> HMM tagging as decoding ■ Decoding : Given as input an HMM λ = (A, B) and sequence of observations O = o 1 , o 2 , …, o n , find the most probable sequence of states Q = q 1 , q 2 , …, q n ˆ t n P ( t n 1 | w n 1 = argmax 1 ) t n 1 P ( w n 1 | t n 1 ) P ( t n 1 ) = argmax P ( w n 1 ) t n 1 7

<latexit sha1_base64="ywGkpQDZc7DefYAK7c3O6+bkg=">AEKXicfVLbtNAFHViCsU8msKSzUAUKQEUJaUINkgVsGCDCBJpK2VCNB5fJ6POw5oZp40sfwsfwNewA7b8CGPHreqmMJLHR/eM/cZJpwZOxj8ajT9G1s3b23fDu7cvXd/p7X74NCoVFMYU8WVPg6JAc4kjC2zHI4TDUSEHI7Ck3eF/2gJ2jAlv9hVAlNB5pLFjBLrTLPWt6CDF8RmNp8Nv0r0BmGi54KczTJbGHI06pYAYcEidFrAXtDZpOFYE5qNuiWj5JaOXiXv5e+Xh5cF+RfulmrPegPyoM2wbACba86o9luU+NI0VSAtJQTYybDQWKnGdGWUQ5gFMDCaEnZA4TByURYKZ2ckcdZwlQrHS7pMWldbLiowIY1YidExB7MJc9RXG63yT1MavpxmTSWpB0nWgOXIKlSMBUVMA7V85QChmrlcEV0Q1PrhudmdCnMAvgSbL0QKqaZicvotZRCkdfFZ+tCA6xBwilVQhAZPc1wTATjqwhiknKbZ9jE5/i6fj2PliwxVesunuRgsdJsziThHGKLi6tudr+FxeUd4PfgBqTho8v6UwKaWKVdJuvVyN3A5vgxLuD/mExeMB2sl5WVCbhir6oBGSWl5ByZQCHc63SpJbwhr5M1D1AYjeGNR/qsjXDbenw6k5ugsO9/vBFf+/zfvgbWv294j74nX9YbeK+/A+CNvLFHG1uNZ439xkv/u/D/+n/XlObjUrz0Ksd/89f32dpgA=</latexit> <latexit sha1_base64="kj8oX+bvtC3juVL/nWM6fABUd8=">ADvHicfVJb9MwFPYaLqNc1sEjL4Zq0kCoagoSvIAm4IEXRJHoNqkuleOcpFZ9iWynWxXlf/BreIW/wL/BScq0rBNHivPp8zk+37lEmeDWDYd/djrBjZu3bu/e6d69d/BXm/4bHVuWEwYVpocxpRC4IrmDjuBJxmBqiMBJxEyw/V/ckKjOVafXPrDGaSponFHnqXlv1CUL6gpXzsPvCr/FhJpU0vN54SqixOPDGmAieYzPKvhs3usPB8Pa8DYIN6CPNjae73cMiTXLJSjHBLV2Gg4zNyuocZwJKLskt5BRtqQpTD1UVIKdFXVxJT7wTIwTbfynHK7ZyxEFldauZeQ9JXULe/WuIq+7m+YueTMruMpyB4o1iZJcYKdx1SkcwPMibUHlBnutWK2oIYy5/vZPbicZgFiBa5dCJOzwiZ19pakSJbt4POm0C4xoOCMaSmpip8XJKGSi3UMCc2FKwtik3/4un69iFc8s5vWXTwpwBFteMoVFQISR6qjTfvfwpH67JKP4Adk4LNX/SUDQ502XkmzE6UfWEqekAr+z5OrC08P2UVtQBfTNUXnYEqyhoyoS2QKDU6z1qCt+Jrof4BmvgxNP7QDms8/JaGV3dyGxyPBuHLwejrq/7R+82+7qLH6Ck6RCF6jY7QJzRGE8TQD/QT/UK/g3dBHCwD2bh2djYxj1DLgtVfxFEqg=</latexit> <latexit sha1_base64="9BSv32hbIdli0R5g8Y34vtwAIU=">AD+3icfVJNb9NAEN0k0Bbz0RSOXBaiSglCUVKQ4IJUAQcuiCRtlI2ROv1OFl1P8zuOm1k+dwQ1z5LYgfg8TaTqu6qRjJ6eZN7szbyZMBLduMPjTaLZu3d7a3rkT3L13/8Fue+/hkdWpYTBmWmhzElILgisYO+4EnCQGqAwFHIen74r48RKM5Vp9casEpLOFY85o867Zu1vwT5ZUJe5fDb8qvAbTKiZS3o+y1zhyPGoWwJMJI/wWQF7wSaLxIaybNQtCSW1DPTW2b38ItbLZ+3OoD8oDW+C4Rp0NpGs72mIZFmqQTlmKDWToaDxE0zahxnAvKApBYSyk7pHCYeKirBTrNSmxzve0+EY238pxwuvVczMiqtXcnQMyV1C3s9Vjhvik1SF7+eZlwlqQPFqofiVGCncSE0jrgB5sTKA8oM97VitqBeJufH4VW/8swCxBJcvREmp5mNy9drJYUyryefV40GxICM6alpCp6lpGYSi5WEcQ0FS7PiI0v8E16PY+WPLFr6S6vFOCINnzOFRUCYkeKo+72v4Uj5RmQ9+AHZOCjr/pTAoY6bXwl1a7kfmBz8oQU8H9Mri6ZHtbysoCfDOFLjoBleUlZEJbIOHc6DSpFbyRXxbqL6CxH0PFh3paxfBbOry+k5vg6KA/fNE/+Pyc/h2va876DF6irpoiF6hQ/QBjdAYMfQb/W1sNbZbet760frZ0VtNtY5j1DNWr/+AWJYWpg=</latexit> HMM tagging as decoding ■ Decoding : Given as input an HMM λ = (A, B) and sequence of observations O = o 1 , o 2 , …, o n , find the most probable sequence of states Q = q 1 , q 2 , …, q n ˆ t n P ( t n 1 | w n 1 = argmax 1 ) t n 1 P ( w n 1 | t n 1 ) P ( t n 1 ) = argmax P ( w n 1 ) t n 1 P ( w n 1 | t n 1 ) P ( t n = argmax 1 ) t n 1 7

Algorithms for NLP CS 11-711 Fall 2020 Lecture 8: Viterbi, - PowerPoint PPT Presentation

Algorithms for NLP CS 11-711 Fall 2020 Lecture 8: Viterbi, discriminative sequence labeling, NER Emma Strubell Announcements Project 1 is due tomorrow! You may submit up to 3 days late (out of a budget of 5 total for the semester).

SI485i : NLP Missing Topics and the Future Who cares about NLP? NLP has expanded quickly

SI425 : NLP Missing Topics and the Future Who cares about NLP? NLP has expanded quickly

NLP: Two pictures Wordnet and Word Sense Problem NLP Disambiguation Semantics NLP Trinity

Recurrent Neural Networks Graham Neubig Site https://phontron.com/class/nn4nlp2017/ NLP and

Natural Language Processing (NLP) In 11-711 Algorithms for NLP we take an

Ontologies for NLP NLP for Ontologies FOIS 2014 - LogOnto Workshop on Logics and Ontologies for

Algorithms for NLP 11-711, Fall 2019 Lecture 26: Computational Ethics Yulia Tsvetkov 1

Algorithms for NLP IITP, Fall 2019 Lecture 25: Computational Ethics Yulia Tsvetkov 1 Tsvetkov

Facing NLP German Rigau i Claramunt http://adimen.si.ehu.es/~rigau IXA group Departamento de

IXA pipes: Efficient and Ready to Use Multilingual NLP tools Rodrigo Agerri IXA NLP Group,

Prominent Research Directions in NLP Alexander Panchenko Assistant Professor for NLP About

Deep Learning for NLP Kiran Vodrahalli Feb 11, 2015 Overview What is NLP? Natural

Hybrid NLP Hybrid NLP O UTLINE O UTLINE Problems of Deep and Shallow Processing

NLP Programming Tutorial 4 - Word Segmentation Graham Neubig Nara Institute of Science and

SI485i : NLP Set 12 Features and Prediction What is NLP, really? Many of our tasks boil down

Capsule Networks for NLP Will Merrill Advanced NLP 10/25/18 Capsule Networks: A Better ConvNet

Technical Assistance Session Community Aw ard Program June 16 th , 2020 4:00-5:00pm Connecting

Ru Rule les: s: BE BEPS PS Ac Actio ion 12 12 OUTLINE Purpose 3 Key Outputs

Aviation Demand Forecasts Probabilistic Forecast Peer Review Key Issues and

The Charities Property Association The impact of the GDPR (including its affect on your

Statistical Natural Language Processing 4 / 26 the lexicon does not grow Closed class words

Graphs p Carola Wenk Slides courtesy of Charles Leiserson with Slides courtesy of Charles

Empirical Methods in Natural Language Processing Lecture 19 Machine translation (VI): Factored

Data Structures Output: for all v V . d [ v ] = discovery time ( v turns from white