Sub-quadratic Markov tree mixture models for probability density - PowerPoint PPT Presentation

Sub-quadratic mixture models Sub-quadratic Markov tree mixture models for probability density estimation Sourour Ammar 1 , Ph. Leray 1 , L. Wehenkel 2 1 Equipe COnnaissances et D´ ecision, LINA UMR 6241 Ecole Polytechnique de l’Universit´ e de Nantes 2 Department of EECS and GIGA-Research, University of Li` ege COMPSTAT’2010 - Paris - 22-27 August 2010 S. Ammar et al. Sub-quadratic mixture models (1/22)

Sub-quadratic mixture models A simple idea Proposition Develop density estimation techniques that could scale to very high-dimensional spaces, by exploiting the Perturb & Combine idea with probabilistic graphical models. Outline Background Our proposal Some results Conclusions and Further works S. Ammar et al. Sub-quadratic mixture models (2/22)

Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) Learning algorithm (research proc.) How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) Learning Perturb Weak algorithm algorithm (randomization) (research proc.) How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

� � � Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) Learning Perturb Weak algorithm algorithm (randomization) (research proc.) Weak Weak Weak algorithm algorithm algorithm 1 m 2 How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

� � � � � � Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) Learning Perturb Weak algorithm algorithm (randomization) (research proc.) Weak Weak Weak algorithm algorithm algorithm 1 m 2 prediction 1 prediction 2 prediction m How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

� � � � � � Sub-quadratic mixture models Background Perturb and combine principle P&C principle in supervised learning Principle : (Bagging, Random forests, Extremely randomized trees) Learning Perturb Weak algorithm algorithm (randomization) (research proc.) Weak Weak Weak algorithm algorithm algorithm 1 m 2 prediction 1 prediction 2 prediction m Combine (Weighting schema) Final prediction How can we apply this idea to density estimation with Bayesian networks (BN)? S. Ammar et al. Sub-quadratic mixture models (3/22)

Sub-quadratic mixture models Background Density estimation with BN Density estimation with BN A B D E C S. Ammar et al. Sub-quadratic mixture models (4/22)

Sub-quadratic mixture models Background Density estimation with BN Density estimation with BN ˜ S A B D E C S. Ammar et al. Sub-quadratic mixture models (4/22)

Sub-quadratic mixture models Background Density estimation with BN Density estimation with BN ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 1 0 0 0 0 A B 1 1 1 1 1 0 0 0 0 1 D E C 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 S. Ammar et al. Sub-quadratic mixture models (4/22)

Sub-quadratic mixture models Background Density estimation with BN Density estimation with BN ˜ S A B C D E 0 0 1 0 0 B D 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 C 0 0 0 0 1 E 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 A 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 S. Ammar et al. Sub-quadratic mixture models (4/22)

� � � Sub-quadratic mixture models Background Density estimation with BN Density estimation with BN ˜ S A B C D E 0 0 1 0 0 B D 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 C 0 0 0 0 1 E 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 A 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 S. Ammar et al. Sub-quadratic mixture models (4/22)

Sub-quadratic mixture models Background Density estimation with BN Bayesian averaging Instead of searching for an optimal model (structure + parameters): Assume prior probabilities over the space of structures Determine posterior probabilities of each model given a dataset approach the target distribution by avereaging the different models wighted by their posterior probabilities Caveats : Exact Bayesian averaging over large space of models is not ‘scalable’ ⇒ requires to strongly constrain the space of structures S. Ammar et al. Sub-quadratic mixture models (5/22)

Sub-quadratic mixture models Outline Background Our proposal Some results Conclusions and Further works S. Ammar et al. Sub-quadratic mixture models (6/22)

Sub-quadratic mixture models Proposal Strategy Use simple spaces of graphical structures ˜ S (e.g. chains, trees, poly-trees etc.) Do not assume that target distribution is representable by one of these structures Rather, assume that target distribution may be approximated well by a mixture of a reasonable number of ( S , θ ∗ ) pairs, S ∈ ˜ S S. Ammar et al. Sub-quadratic mixture models (7/22)

Sub-quadratic mixture models Proposal Generic algorithm principle ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 S. Ammar et al. Sub-quadratic mixture models (8/22)

� � � � Sub-quadratic mixture models Proposal Generic algorithm principle ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 T 1 T 2 T m 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 S. Ammar et al. Sub-quadratic mixture models (8/22)

� � � � � � Sub-quadratic mixture models Proposal Generic algorithm principle ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 T 1 T 2 T m 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 θ ∗ θ ∗ θ ∗ 1 2 m S. Ammar et al. Sub-quadratic mixture models (8/22)

� � � � � � Sub-quadratic mixture models Proposal Generic algorithm principle ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 T 1 T 2 T m 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 θ ∗ θ ∗ θ ∗ 1 2 m µ 1 µ 2 µ m S. Ammar et al. Sub-quadratic mixture models (8/22)

� � � � � � Sub-quadratic mixture models Proposal Generic algorithm principle ˜ S A B C D E 0 0 1 0 0 0 1 1 1 1 T 1 T 2 T m 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 θ ∗ θ ∗ θ ∗ 1 2 m µ 1 µ 2 µ m Final model ( θ ∗ i , µ i ) i =1 .. m S. Ammar et al. Sub-quadratic mixture models (8/22)

� � � � � � Sub-quadratic mixture models Proposal Degrees of freedom ˜ S What space ˜ S ? A B C D E 0 0 1 0 0 0 1 1 1 1 T 1 T 2 T m 1 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 θ ∗ θ ∗ θ ∗ 1 2 m µ 1 µ 2 µ m Final model ( θ ∗ i , µ i ) i =1 .. m S. Ammar et al. Sub-quadratic mixture models (9/22)

Sub-quadratic Markov tree mixture models for probability density - PowerPoint PPT Presentation

Sub-quadratic mixture models Sub-quadratic Markov tree mixture models for probability density estimation Sourour Ammar 1 , Ph. Leray 1 , L. Wehenkel 2 1 Equipe COnnaissances et D ecision, LINA UMR 6241 Ecole Polytechnique de lUniversit e

Hidden Markov Models Discrete Markov Processes 1 Hidden Markov Models Hidden Markov Models 2

Structure of mixture models Victor Medina Researcher at SBIF DataCamp Mixture Models in R

Bernoulli Mixture Models Victor Medina Researcher at SBIF DataCamp Mixture Models in R The

Markov Chains Markov Processes Discrete-time Markov Chains Continuous-time Markov Chains Dr

The quadratic formula You may recall the quadratic formula for roots of quadratic polynomials ax 2

Visualizing Model Architecture john.sekar@mssm.edu SASB `17 Kinetics ~ Reaction Rules Enz Sub

CSCE 471/871 Lecture 3: Markov Chains Markov Chains and and Hidden Markov Models Hidden

Markov chains and Hidden Markov Models 9000 Markov chains and HMMs We will discuss: Markov

Probability Basics Martin Emms October 1, 2020 Probability Basics Outline Probability

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University Markov Chains and

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University 2 Markov Chains

Hidden Markov Models Steven J Zeil Old Dominion Univ. Fall 2010 1 Discrete Markov Processes

Markov Logic Markov Logic Probability First-Order Logic Propositional Logic Markov Logic

Outline depmixS4: an R-package for hidden Markov models Hidden Markov Models Ingmar Visser 1

Are Hybrid Physical Designs Important? 1 B+ tree 2 C O L B+ tree 3 ? C O L C O L B+ tree

Markov processes (Markov chains) Construct a Bayes net from these variables: parents? Markov

Generative networks part 2: GANs 23 / 54 Recap on generative networks Generative networks provide

Notes and Announcements Midterm exam: Oct 20 , Wednesday, In Class Late Homeworks Turn

Non-parametric Methods Oliver Schulte - CMPT 726 Bishop PRML Ch. 2.5 Kernel Density Estimation

via Threshold-Based Pruning Edward Gan & Peter Bailis 1 MacroBase: Analytics on Fast Streams

Extended Path Integral Formulation for Volumetric Transport T. Hachisuka I. Georgiev W. Jarosz

Probabilistic Graphical Models Probabilistic Graphical Models introduction to learning Siamak

Average-Case Acceleration Through Spectral Density Estimation and Universal Asymptotic Optimality

Statistical Geometry Processing Winter Semester 2011/2012 Machine Learning Topics Topics

Sub-quadratic Markov tree mixture models for probability density - PowerPoint PPT Presentation

Sub-quadratic mixture models Sub-quadratic Markov tree mixture models for probability density estimation Sourour Ammar 1 , Ph. Leray 1 , L. Wehenkel 2 1 Equipe COnnaissances et D ecision, LINA UMR 6241 Ecole Polytechnique de lUniversit e

Hidden Markov Models Discrete Markov Processes 1 Hidden Markov Models Hidden Markov Models 2

Structure of mixture models Victor Medina Researcher at SBIF DataCamp Mixture Models in R

Bernoulli Mixture Models Victor Medina Researcher at SBIF DataCamp Mixture Models in R The

Markov Chains Markov Processes Discrete-time Markov Chains Continuous-time Markov Chains Dr

The quadratic formula You may recall the quadratic formula for roots of quadratic polynomials ax 2

Visualizing Model Architecture john.sekar@mssm.edu SASB `17 Kinetics ~ Reaction Rules Enz Sub

CSCE 471/871 Lecture 3: Markov Chains Markov Chains and and Hidden Markov Models Hidden

Markov chains and Hidden Markov Models 9000 Markov chains and HMMs We will discuss: Markov

Probability Basics Martin Emms October 1, 2020 Probability Basics Outline Probability

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University Markov Chains and

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University 2 Markov Chains

Hidden Markov Models Steven J Zeil Old Dominion Univ. Fall 2010 1 Discrete Markov Processes

Markov Logic Markov Logic Probability First-Order Logic Propositional Logic Markov Logic

Outline depmixS4: an R-package for hidden Markov models Hidden Markov Models Ingmar Visser 1

Are Hybrid Physical Designs Important? 1 B+ tree 2 C O L B+ tree 3 ? C O L C O L B+ tree

Markov processes (Markov chains) Construct a Bayes net from these variables: parents? Markov

Generative networks part 2: GANs 23 / 54 Recap on generative networks Generative networks provide

Notes and Announcements Midterm exam: Oct 20 , Wednesday, In Class Late Homeworks Turn

Non-parametric Methods Oliver Schulte - CMPT 726 Bishop PRML Ch. 2.5 Kernel Density Estimation

via Threshold-Based Pruning Edward Gan &amp; Peter Bailis 1 MacroBase: Analytics on Fast Streams

Extended Path Integral Formulation for Volumetric Transport T. Hachisuka I. Georgiev W. Jarosz

Probabilistic Graphical Models Probabilistic Graphical Models introduction to learning Siamak

Average-Case Acceleration Through Spectral Density Estimation and Universal Asymptotic Optimality

Statistical Geometry Processing Winter Semester 2011/2012 Machine Learning Topics Topics

via Threshold-Based Pruning Edward Gan & Peter Bailis 1 MacroBase: Analytics on Fast Streams