Semi-Supervised Learning
Jia-Bin Huang Virginia Tech
Spring 2019
ECE-5424G / CS-5824
Semi-Supervised Learning Jia-Bin Huang Virginia Tech Spring 2019 - - PowerPoint PPT Presentation
Semi-Supervised Learning Jia-Bin Huang Virginia Tech Spring 2019 ECE-5424G / CS-5824 Administrative HW 4 due April 10 Recommender Systems Motivation Problem formulation Content-based recommendations Collaborative filtering
Jia-Bin Huang Virginia Tech
Spring 2019
ECE-5424G / CS-5824
Movie Alice (1) Bob (2) Carol (3) Dave (4) ๐ฆ1 (romance) ๐ฆ2 (action) Love at last
5 5 0.9
Romance forever
5 ? ? 1.0 0.01
Cute puppies
? 4 ? 0.99
Nonstop car chases
5 4 0.1 1.0
Swords vs. karate
5 ? 0.9
Movie Alice (1) Bob (2) Carol (3) Dave (4) ๐ฆ1 (romance) ๐ฆ2 (action) Love at last
5 5 ? ?
Romance forever
5 ? ? ? ?
Cute puppies
? 4 ? ? ?
Nonstop car chases
5 4 ? ?
Swords vs. karate
5 ? ? ?
๐ 1 = 5 ๐ 2 = 5 ๐ 3 = 5 ๐ 4 = 5 ๐ฆ 1 = ? ? ?
min
๐ฆ(๐)
1 2 เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐
๐ฆ๐
(๐) 2
min
๐ฆ(1),๐ฆ(2),โฏ,๐ฆ(๐๐)
1 2 เท
๐=1 ๐๐
เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
Can estimate ๐ 1 , ๐ 2 , โฏ , ๐ ๐๐ฃ
Can estimate ๐ฆ 1 , ๐ฆ 2 , โฏ , ๐ฆ ๐๐
min
๐ 1 ,๐ 2 ,โฏ,๐ ๐๐ฃ
1 2 เท
๐=1 ๐๐ฃ
เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
min
๐ฆ(1),๐ฆ(2),โฏ,๐ฆ(๐๐)
1 2 เท
๐=1 ๐๐
เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
min
๐ 1 ,๐ 2 ,โฏ,๐ ๐๐ฃ
1 2 เท
๐=1 ๐๐ฃ
เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
min
๐ฆ(1),๐ฆ(2),โฏ,๐ฆ(๐๐)
1 2 เท
๐=1 ๐๐
เท
๐:๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
๐พ = 1 2 เท
๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
+ ๐ 2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
๐พ(๐ฆ 1 , ๐ฆ 2 , โฏ , ๐ฆ ๐๐ , ๐ 1 , ๐ 2 , โฏ , ๐ ๐๐ฃ ) = 1 2 เท
๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
+ ๐ 2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
descent (or an advanced optimization algorithm). For every ๐ = 1 โฏ ๐๐ฃ, ๐ = 1, โฏ , ๐๐: ๐ฆ๐
๐ โ ๐ฆ๐ ๐ โ ๐ฝ
เท
๐:๐ ๐,๐ =1
( ๐ ๐
โค ๐ฆ ๐
โ ๐ง ๐,๐ ) ๐๐
๐ + ๐ ๐ฆ๐ (๐)
๐๐
๐ โ ๐๐ ๐ โ ๐ฝ
เท
๐:๐ ๐,๐ =1
( ๐ ๐
โค ๐ฆ ๐
โ ๐ง ๐,๐ ) ๐ฆ๐
๐ + ๐ ๐๐ (๐)
a star rating of ๐โค๐ฆ
Movie Alice (1) Bob (2) Carol (3) Dave (4) Love at last
5 5
Romance forever
5 ? ?
Cute puppies of love
? 4 ?
Nonstop car chases
5 4
Swords vs. karate
5 ?
๐ = โ ๐ฆ 1
โค โ
โ ๐ฆ 2
โค โ
โฎ โ ๐ฆ ๐๐
โค โ
ฮ = โ ๐ 1
โค โ
โ ๐ 2
โค โ
โฎ โ ๐ ๐๐ฃ
โค โ
Low-rank matrix factorization
๐ฆ1: romance, ๐ฆ2: action, ๐ฆ3: comedy, โฆ
Small ๐ฆ(๐) โ ๐ฆ(๐) movie j and I are โsimilarโ
1 2 เท
๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
+ ๐ 2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
๐(5) = 0
Movie Alice (1) Bob (2) Carol (3) Dave (4) Eve (5) Love at last
5 5 ?
Romance forever
5 ? ? ?
Cute puppies
? 4 ? ?
Nonstop car chases
5 4 ?
Swords vs. karate
5 ? ?
1 2 เท
๐ ๐,๐ =1
(๐ ๐ )โค ๐ฆ ๐ โ ๐ง ๐,๐
2 + ๐
2 เท
๐=1 ๐๐ฃ
เท
๐=1 ๐
๐๐
๐ 2
+ ๐ 2 เท
๐=1 ๐๐
เท
๐=1 ๐
๐ฆ๐
(๐) 2
๐(5) = 0
Movie Alice (1) Bob (2) Carol (3) Dave (4) Eve (5) Love at last
5 5
Romance forever
5 ? ?
Cute puppies
? 4 ?
Nonstop car chases
5 4
Swords vs. karate
5 ?
For user ๐, on movie ๐ predict: ๐ ๐
โค ๐ฆ(๐) + ๐๐
User 5 (Eve): ๐ 5 = 0 ๐ 5
โค ๐ฆ(๐) + ๐๐
Learn ๐(๐), ๐ฆ(๐)
Protein sequences Billions of webpages Images
๐๐ = ๐ฆ 1 , ๐ง 1 , ๐ฆ 2 , ๐ง 2 , โฏ , ๐ฆ ๐๐ , ๐ง ๐๐
๐๐ฃ = ๐ฆ 1 , ๐ง 1 , ๐ฆ 2 , ๐ง 2 , โฏ , ๐ฆ ๐๐ฃ , ๐ง ๐๐ฃ
Lafferty โ03]
large margin
Inputs: ๐ฆl
(๐), ๐งl (๐)
min
๐ 1 2 ฯ๐=1 ๐
๐
๐ 2
(๐)๐โค๐ฆ๐ ๐ โฅ 1
Inputs: ๐ฆl
(๐), ๐งl (๐)
, ๐ฆu
(๐), ๐ง๐ฃ (๐)
min
๐ 1 2 ฯ๐=1 ๐
๐
๐ 2
๐งl
(๐)๐โค๐ฆ๐ ๐ โฅ 1
เทข ๐งu
(๐)๐โค๐ฆ ๐ โฅ 1
เทข ๐งu
๐ โ {โ1, 1}
separator.
margin
๐ฆ of data points ๐ฆ โ ๐ธ๐๐ should not significantly change the output of h๐(๐ฆ)