Logis&c ¡Regression ¡
Debapriyo Majumdar Data Mining – Fall 2014 Indian Statistical Institute Kolkata
September 1, 2014
Recall: Linear Regression 200 180 160 140 Power - - PowerPoint PPT Presentation
Logis&c Regression Debapriyo Majumdar Data Mining Fall 2014 Indian Statistical Institute Kolkata September 1, 2014 Recall: Linear Regression 200 180 160 140 Power (bhp) 120
September 1, 2014
2 ¡
0 ¡ 20 ¡ 40 ¡ 60 ¡ 80 ¡ 100 ¡ 120 ¡ 140 ¡ 160 ¡ 180 ¡ 200 ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡
Engine ¡displacement ¡(cc) ¡ Power ¡(bhp) ¡
0 ¡ 20 ¡ 40 ¡ 60 ¡ 80 ¡ 100 ¡
3 ¡
Age (X) Heart disease (Y)
No ¡ Yes ¡
Training set
0 ¡ 20 ¡ 40 ¡ 60 ¡ 80 ¡ 100 ¡
4 ¡
Age (X) Heart disease (Y)
No ¡ Yes ¡
Training set
5 ¡
Probability of the dependent variable Y taking one value against another
6 ¡
– For x = 1, p(x;θ) = θ – For x = 0, p(x;θ) = 1−θ
i=1 n
7 ¡
i=1 n
i=1 n
i=1 n
8 ¡
9 ¡
i=1 n
10 ¡
f (x) = f (a)+ f '(a) 1! (x − a)+...+ f (k−1)(a) k! (x − a)k
P(x)
! " ####### $ ####### + hk(x)(x − a)k
Polynomial approximation (k-th order Taylor’s polynomial)
limx→a hk(x)
1. The function f is smooth 2. The derivative of f at w* is 0, second derivative is negative
11 ¡
w=w0
12 ¡
13 ¡
i=1 n
i=1 n
14 ¡
0 ¡ 20 ¡ 40 ¡ 60 ¡ 80 ¡ 100 ¡
Age (X) Heart disease (Y) No ¡ Yes ¡ 0.5 ¡ 0.75 ¡ 0.25 ¡
15 ¡
0 ¡ 20 ¡ 40 ¡ 60 ¡ 80 ¡ 100 ¡
Age (X) Heart disease (Y) No ¡ Yes ¡ 0.5 ¡ 0.75 ¡ 0.25 ¡
16 ¡
30 40 50 60 70 80 50 100 150 200 Age (Years) Income (thousand rupees)
0.5 ¡ 0.25 ¡ 0.75 ¡
Wrapping up classification
17 ¡
18 ¡
19 ¡