Data Mining 2020 Bayesian Networks (1)
Ad Feelders
Universiteit Utrecht
Ad Feelders ( Universiteit Utrecht ) Data Mining 1 / 49
Data Mining 2020 Bayesian Networks (1) Ad Feelders Universiteit - - PowerPoint PPT Presentation
Data Mining 2020 Bayesian Networks (1) Ad Feelders Universiteit Utrecht Ad Feelders ( Universiteit Utrecht ) Data Mining 1 / 49 Do you like noodles? Do you like noodles? Race Gender Yes No Black Male 10 40 Female 30 20 White
Ad Feelders ( Universiteit Utrecht ) Data Mining 1 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 2 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 3 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 4 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 5 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 6 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 7 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 8 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 9 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 10 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 11 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 12 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 13 / 49
1 This is an identity of probability theory, no independence assumptions
2 The joint probability of any initial segment X1, X2, . . . , Xj (1 ≤ j ≤ k)
Ad Feelders ( Universiteit Utrecht ) Data Mining 14 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 15 / 49
1 X1 ⊥
2 X4 ⊥
3 X1 ⊥
Ad Feelders ( Universiteit Utrecht ) Data Mining 16 / 49
1 If X1 ⊥
Ad Feelders ( Universiteit Utrecht ) Data Mining 17 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 18 / 49
2 If X4 ⊥
Ad Feelders ( Universiteit Utrecht ) Data Mining 19 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 20 / 49
3 If X1 ⊥
Ad Feelders ( Universiteit Utrecht ) Data Mining 21 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 22 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 23 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 24 / 49
1 For each i ∈ K, we connect all vertices in pa(i) with undirected edges. 2 We replace all directed edges in E with undirected ones.
Ad Feelders ( Universiteit Utrecht ) Data Mining 25 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 26 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 27 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 28 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 29 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 30 / 49
1 This is a product of factors P(Xℓ|Xpa(ℓ)), involving the variables
2 So it factorizes according to G m
3 Hence, if S separates i from j in G m
Ad Feelders ( Universiteit Utrecht ) Data Mining 31 / 49
a P(A = a | G, R) = 1) Ad Feelders ( Universiteit Utrecht ) Data Mining 32 / 49
1 Are X3 and X4 independent? 2 Are X1 and X3 independent? 3 Are X3 and X4 independent given X5? 4 Are X1 and X3 independent given X5? Ad Feelders ( Universiteit Utrecht ) Data Mining 33 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 34 / 49
1 Parameter learning: structure known/given; we only need to estimate
2 Structure learning: structure unknown; we need to learn the networks
Ad Feelders ( Universiteit Utrecht ) Data Mining 35 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 36 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 37 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 38 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 39 / 49
n
n
k
i
pa(i)),
k
Ad Feelders ( Universiteit Utrecht ) Data Mining 40 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 41 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 42 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 43 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 44 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 45 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 46 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 47 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 48 / 49
Ad Feelders ( Universiteit Utrecht ) Data Mining 49 / 49