Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von - PowerPoint PPT Presentation

Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von Brzeski vvonbrze@ucsc.edu

Reference • Hierarchical Dirichlet Processes , Y. Teh, M. Jordan, M. Beal, D. Blei, Technical Report 653, Statistics, UC Berkeley, 2004. – Also published in NIPS 2004 : Sharing Clusters among Related Groups: Hierarchical Dirichlet Processes • Some figures and equations shown here are directly taken from the above references (indicated if so) 2

✄ ✑ ✑ ✟ ✄ ✜ ☎ ✕ ✟ ☎ ✠ ✑ ✛ ✘ ☎ ✙ ✚ ☎ ✠ ✖ ✠ ✢ ✠ ✝ ✝ ✞ ✟ ✡ ✞ ✠ ☛ ✏ ✍✎ ☎ ✏ ✠ ✟ Source: Teh, 2004. 3 ✒✔✓ The HDP Prior ✡✗✖ ✄✆☎ ✄✆☎ �✂✁ �✌☞

✔ ✢ ✕ ✖ ✠ ✗ ✠ ✘ ✒ ✙ ✓ ✚ ✛ ✖ ✠ ✗ ✠ ✘ ✒ � ✒ ✜ ✁ ✆ ✠✡ ✆ ☞ ☛ ☛ ✏ ✁ ✞ ✑ ✄ ✁ ✂ ✍ ✂☎✄ ✝✟✞ ✂☎☛ ✌✎✍ Going back to original definition of DP, we can derive relationship between and : 4 Source: Teh, 2004.

✄ � ✄ ✂ ✁ ✂ ✁ � ✂ ✁ ✆ ☎ ✂ ✁ � ✄ ✄ ✂ ✁ ✁ ✂ ✄ ✄ ✁ ✂ � ✁ ✂ ✄ ✄ 5 ☎✝✆ ☎✝✆ ☎✞✆

� ✁ ✆ ✝✞ ✟✠ ✌ ✍ 6 ✡☞☛ ✂☎✄ G 0 G j

� ✌ ☞ ✍ ✔ ✄ ✓ ✎ ✒ ✍ ✌ ☞ ✎ ✌ ✑ ✁ ✌ ☞ ✌ ☞ ☛ ✡ ✠ ✞✟ ✝ ✄ ✕✗✖ ✍✏✎ ✍✏✎ ✂✄✆☎ G 0

� ✁ ✂ ✠ ☞ ✌ ✍ ✞ ✎ ✏ Prior and Data Model ✄✆☎ ✝✟✞ �☛✡ 8 Source: Teh, 2004.

✌ ✥ ★ ✥ ✫ ✜ ✦ ✜ ✩✪ ★ ✦✧ ✜ ✣ ✥ ✤ ✣ ✢ ✜ ✛ ✒ ✓ ✩✪ ✜ ✑ ✜ ✭ ✮✯ ✬✭ ✫ ✜ ✦ ✥ ✦ ✦ ✢ ✭ ✮✯ ✬✭ ✧ ✦ ✣ ✥ ✤ ✣ ✦ ✘ ✜ ✠✍ ✓ ✠✒ ✌ ✑ ✏ ✆ ✌ ✎ ✌ ✔ ✄ ☛☞ ✆ ✡ ✠ ✥ ✆ ☎ ✄ ✒ ✒ ✠ ✁ ✆ ✞ ✚ ✙ ✓ ✓ ✒ ✘ ✞ ✓ � ✗ ✕ ✠ ✆ ✞ ✖ ✆ ✕ ✦ Source: Teh, 2004. 9 ✝✟✞ �✂✁

Application : Topic Modeling • Topic = (multinomial) distribution over words – Fixed size vocabulary; p(word | topic) – F : Multinomial kernel, H : Dirichlet() • Document = mixture of one or more topics • Goal = recover latent topics; use topics for clustering, finding related documents, etc. 10

✖ ✠ ✁ ✖ ✗ ✄ ✠ ✁ ✂ ✕ ✓ � ✌✔ ✓ ✠ ✌✏ ✎ ✠ ☛ � ✁ ✂ ✌ ☞ ✍ ✄✆☎ ✄✡✠ ☛✡✖ ✝✟✞ ✑✟✒ 3 TRUE TOPICS J = 6 docs (80 – 100 words / doc) p = [0.4, 0.3, 0.3] 2 – 3 mix components / doc Σ V (vocabulary size) = 10 11

Inference via Gibbs Sampling 1. 2. 3. 12 Source: Teh, 2004.

� � � � � � � TRUTH : ESTIMATE : For each x ji whose true component was k, we have B MCMC draws: { (1) , (2) ,….., (B) } ji ji ji 1 (B) = (b) ji ji Σ B b 1 k = (B) Σ 13 ji n k

� ✁ Truth vs. Posterior Point and 10/90 Interval Estimates for E[ j | data ] 14 True Estimate j

� ✁ Simulated Data Histograms vs. Est. Posterior Predictive : E[ j0 | data ] (b) via CRP config @ state b. For each doc j : avg (over states b = 1..B) draws of j0 15 Data Est Post. Predictive

Simulated Data Distributions vs. Est. Posterior Predictive for New Observation x j0 Data histogram Data density est. Predictive x 0 16

R Code Available • Works, but SLOOOOOOOOOW…. http://www.numberjack.net/download/classes/ams241/project/R 17

Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von - PowerPoint PPT Presentation

Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von Brzeski vvonbrze@ucsc.edu Reference Hierarchical Dirichlet Processes , Y. Teh, M. Jordan, M. Beal, D. Blei, Technical Report 653, Statistics, UC Berkeley, 2004. Also

Hierarchical Dirichlet Processes Presenters: Micah Hodosh, Yizhou Sun 4/7/2010 1 Content

Perspective Hierarchical Dirichlet Process for Perspective Hierarchical Dirichlet Process for

Nested Hierarchical Dirichlet Processes John Paisley, Chong Wang, David M. Blei, and Michael I.

The Dirichlet-Bohr radius Manuel Maestre April 13, 2014 Kent State University Content

Hierarchical Dirichlet Processes Sharing Clusters Among Related Groups Dongruo Zhou 1 Difan Zou 2

Reliable Variational Learning for Hierarchical Dirichlet Processes Erik Sudderth Brown University

Probabilistic Grammars and Hierarchical Dirichlet Processes (Liang et. al 2009) Sean Massung &

Boundary Representation of Dirichlet Forms on Canonically Compactifiable Graphs Michael Schwarz

Hierarchical Bounding Volume October 11, 2005 () Hierarchical Bounding Volume October 11, 2005

What is a hierarchical model? Richard Erickson Quantitative Ecologist DataCamp Hierarchical

Lecture 14: Inference in Dirichlet Processes (Blei & Jordan, Variational inference for

Accurate parameter estimation for Bayesian network classifiers using hierarchical Dirichlet

Birth and Death Processes Today: Birth processes Birth and Death Processes Death

Programs, Processes, and Threads Programs, Processes, and Threads (Chapter 2) Processes

Bayesian hierarchical models in Stata Nikolay Balov StataCorp LP 2016 Stata Conference Nikolay

Unsupervised Learning and Clustering Owen Roberts, Zach Busser, Ganesh Sugunan Hierarchical

Disclosure Risk Measurement with Entropy in Sample Based Frequency Tables L. Antal N. Shlomo M.

Playing Anonymous Games Using Simple Strategies Yu Cheng Ilias Diakonikolas Alistair Stewart

Public Outreach for 2045 RTP Technical Advisory Committee February 14, 2018 What is the Regional

Regional Multimodal Freight Plan Update Presented by: Matthew Helfant Advisory Committee Evan

An Assessment of Potential Impact of Climate Change on Forest Distribution and Economic Value in

On-line Fusion of Functional Knowledge Within Distributed Sensor Networks Dominik Fisch, Bernhard

RNNs for Image Caption Generation James Guevara Recurrent Neural Networks Contain at least

Teachers Name X Grade KCCT Assessment The Kentucky Core Content Test (KCCT) is a

Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von - PowerPoint PPT Presentation

Hierarchical Dirichlet Processes AMS 241, Fall 2010 Vadim von Brzeski vvonbrze@ucsc.edu Reference Hierarchical Dirichlet Processes , Y. Teh, M. Jordan, M. Beal, D. Blei, Technical Report 653, Statistics, UC Berkeley, 2004. Also

Hierarchical Dirichlet Processes Presenters: Micah Hodosh, Yizhou Sun 4/7/2010 1 Content

Perspective Hierarchical Dirichlet Process for Perspective Hierarchical Dirichlet Process for

Nested Hierarchical Dirichlet Processes John Paisley, Chong Wang, David M. Blei, and Michael I.

The Dirichlet-Bohr radius Manuel Maestre April 13, 2014 Kent State University Content

Hierarchical Dirichlet Processes Sharing Clusters Among Related Groups Dongruo Zhou 1 Difan Zou 2

Reliable Variational Learning for Hierarchical Dirichlet Processes Erik Sudderth Brown University

Probabilistic Grammars and Hierarchical Dirichlet Processes (Liang et. al 2009) Sean Massung &amp;

Boundary Representation of Dirichlet Forms on Canonically Compactifiable Graphs Michael Schwarz

Hierarchical Bounding Volume October 11, 2005 () Hierarchical Bounding Volume October 11, 2005

What is a hierarchical model? Richard Erickson Quantitative Ecologist DataCamp Hierarchical

Lecture 14: Inference in Dirichlet Processes (Blei &amp; Jordan, Variational inference for

Accurate parameter estimation for Bayesian network classifiers using hierarchical Dirichlet

Birth and Death Processes Today: Birth processes Birth and Death Processes Death

Programs, Processes, and Threads Programs, Processes, and Threads (Chapter 2) Processes

Bayesian hierarchical models in Stata Nikolay Balov StataCorp LP 2016 Stata Conference Nikolay

Unsupervised Learning and Clustering Owen Roberts, Zach Busser, Ganesh Sugunan Hierarchical

Disclosure Risk Measurement with Entropy in Sample Based Frequency Tables L. Antal N. Shlomo M.

Playing Anonymous Games Using Simple Strategies Yu Cheng Ilias Diakonikolas Alistair Stewart

Public Outreach for 2045 RTP Technical Advisory Committee February 14, 2018 What is the Regional

Regional Multimodal Freight Plan Update Presented by: Matthew Helfant Advisory Committee Evan

An Assessment of Potential Impact of Climate Change on Forest Distribution and Economic Value in

On-line Fusion of Functional Knowledge Within Distributed Sensor Networks Dominik Fisch, Bernhard

RNNs for Image Caption Generation James Guevara Recurrent Neural Networks Contain at least

Teachers Name X Grade KCCT Assessment The Kentucky Core Content Test (KCCT) is a

Probabilistic Grammars and Hierarchical Dirichlet Processes (Liang et. al 2009) Sean Massung &

Lecture 14: Inference in Dirichlet Processes (Blei & Jordan, Variational inference for