Nearest neighbor methods Lecture 11 David Sontag New - - PowerPoint PPT Presentation

nearest neighbor methods lecture 11
SMART_READER_LITE
LIVE PREVIEW

Nearest neighbor methods Lecture 11 David Sontag New - - PowerPoint PPT Presentation

Nearest neighbor methods Lecture 11 David Sontag New York University Slides adapted from Vibhav Gogate, Carlos Guestrin, Mehryar Mohri, & Luke Zettlemoyer Nearest Neighbor Algorithm


slide-1
SLIDE 1

Nearest ¡neighbor ¡methods ¡ Lecture ¡11 ¡

David ¡Sontag ¡ New ¡York ¡University ¡

Slides adapted from Vibhav Gogate, Carlos Guestrin, Mehryar Mohri, & Luke Zettlemoyer

slide-2
SLIDE 2

Nearest ¡Neighbor ¡Algorithm ¡

  • Learning ¡Algorithm: ¡

– Store ¡training ¡examples ¡

  • Predic@on ¡Algorithm: ¡

– To ¡classify ¡a ¡new ¡example ¡x ¡by ¡finding ¡the ¡training ¡ example ¡(xi,yi) ¡that ¡is ¡nearest ¡to ¡x ¡ – Guess ¡the ¡class ¡y ¡= ¡yi ¡

slide-3
SLIDE 3

K-­‑Nearest ¡Neighbor ¡Methods ¡

  • To ¡classify ¡a ¡new ¡input ¡vector ¡x, ¡examine ¡the ¡k-­‑closest ¡training ¡data ¡points ¡to ¡x ¡

and ¡assign ¡the ¡object ¡to ¡the ¡most ¡frequently ¡occurring ¡class ¡

x k=1 k=5 common values for k: 3, 5

slide-4
SLIDE 4

Decision ¡Boundaries ¡

  • The ¡nearest ¡neighbor ¡algorithm ¡does ¡not ¡explicitly ¡compute ¡decision ¡
  • boundaries. ¡ ¡However, ¡the ¡decision ¡boundaries ¡form ¡a ¡subset ¡of ¡the ¡Voronoi ¡

diagram ¡for ¡the ¡training ¡data. ¡

The more examples that are stored, the more complex the decision boundaries can become

slide-5
SLIDE 5

Example ¡results ¡for ¡k-­‑NN ¡

Number of Neighbors Misclassification Errors 5 10 15 20 25 30 0.0 0.05 0.10 0.15 0.20 0.25 0.30

  • • • • • • • • • • • • • •
  • • • •
  • • • • • • • • •
  • • • • • • • • • • • • • •

Test Error 10-fold CV Training Error Bayes Error

7-Nearest Neighbors 7-Nearest Neighbors

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

  • Training Error: 0.145

Test Error: 0.225 Bayes Error: 0.210

[Figures ¡from ¡Has@e ¡and ¡Tibshirani, ¡Chapter ¡13] ¡

slide-6
SLIDE 6

Nearest ¡Neighbor ¡

When ¡to ¡Consider ¡ ¡

– Instance ¡map ¡to ¡points ¡in ¡Rn ¡ – Less ¡than ¡20 ¡a]ributes ¡per ¡instance ¡ – Lots ¡of ¡training ¡data ¡

Advantages ¡

– Training ¡is ¡very ¡fast ¡ – Learn ¡complex ¡target ¡func@ons ¡ – Do ¡not ¡lose ¡informa@on ¡

Disadvantages ¡

– Slow ¡at ¡query ¡@me ¡ – Easily ¡fooled ¡by ¡irrelevant ¡a]ributes ¡

slide-7
SLIDE 7

Issues ¡

  • Distance ¡measure ¡

– Most ¡common: ¡Euclidean ¡

  • Choosing ¡k ¡

– Increasing ¡k ¡reduces ¡variance, ¡increases ¡bias ¡

  • For ¡high-­‑dimensional ¡space, ¡problem ¡that ¡the ¡nearest ¡

neighbor ¡may ¡not ¡be ¡very ¡close ¡at ¡all! ¡

  • Memory-­‑based ¡technique. ¡ ¡Must ¡make ¡a ¡pass ¡through ¡

the ¡data ¡for ¡each ¡classifica@on. ¡ ¡This ¡can ¡be ¡prohibi@ve ¡ for ¡large ¡data ¡sets. ¡

slide-8
SLIDE 8

Distance ¡

  • Notation: object with p features
  • Most common distance metric is Euclidean distance:
  • ED makes sense when different features are commensurate; each is

variable measured in the same units.

  • If the features are different, say length and weight, it is not clear.
slide-9
SLIDE 9

Normaliza@on ¡of ¡features ¡

Can divide features by them by the standard deviation, making them all equally important

ˆ σ

k = 1

n x

k

i − x k

( )

2 i=1 n

⎛ ⎝ ⎜ ⎞ ⎠ ⎟

1 2

The estimate for the standard deviation of feature k: where xk is the sample mean:

slide-10
SLIDE 10

Weighted ¡Euclidean ¡distance ¡

Finally, if we have some idea of the relative importance of each variable, we can weight them:

slide-11
SLIDE 11

12

k-­‑NN ¡and ¡irrelevant ¡features ¡

+ + + + + + + +

  • o
  • o
  • ?
slide-12
SLIDE 12

13

k-­‑NN ¡and ¡irrelevant ¡features ¡

+ + + + + + + +

  • ?
slide-13
SLIDE 13

Nearest ¡neighbor ¡problem ¡

[Slides ¡from ¡Mehyrar ¡Mohri] ¡

Problem: given sample , find the nearest neighbor of test point .

  • general problem extensively studied in computer

science.

  • exact vs. approximate algorithms.
  • dimensionality crucial.
  • better algorithms for small intrinsic dimension

(e.g., limited doubling dimension).

S = ((x1, y1), . . . , (xm, ym)) x N

slide-14
SLIDE 14

Efficient ¡Indexing: ¡N=2 ¡

[Slides ¡from ¡Mehyrar ¡Mohri] ¡

Algorithm:

  • compute

Voronoi diagram in .

  • point location data structure to determine NN.
  • complexity: space, time.

O(m log m) O(m) O(log m)

x

slide-15
SLIDE 15

Efficient ¡Indexing: ¡N>2 ¡

[Slides ¡from ¡Mehyrar ¡Mohri] ¡

Voronoi diagram: size in . Linear algorithm (no pre-processing):

  • compute distance for all .
  • complexity of distance computation: .
  • no additional space needed.

Tree-based data structures: pre-processing.

  • often used in applications: -d trees ( -dimensional

trees).

x xi i ∈ [1, m] Ω(Nm) k k O

  • mN/2
slide-16
SLIDE 16

Efficient ¡Indexing ¡for ¡N>2: ¡KD ¡trees ¡

[Slides ¡from ¡Mehyrar ¡Mohri] ¡

(4, 2), X (5, 9), X (3, 5), Y (1, 1) (8, 4) (2, 9.5) (7, 5.5)

Algorithm: for each non-leaf node,

  • choose dimension (e.g., longest of hyperrectangle).
  • choose pivot (median).
  • split node according to (pivot, dimension).

balanced tree, binary space partitioning.

Construc@on ¡algorithm ¡ X Y

10 10

slide-17
SLIDE 17

[Slides ¡from ¡Mehyrar ¡Mohri] ¡

Algorithm:

  • find region containing (starting from root

node, move to child node based on node test).

  • save region point as current best.
  • move up tree and recursively search regions

intersecting hypersphere :

  • update current best if current point is closer.
  • restart search with each intersecting sub-tree.
  • move up tree when no more intersecting sub-

tree.

x x0 S(x, x x0) Search ¡algorithm ¡

Efficient ¡Indexing ¡for ¡N>2: ¡KD ¡trees ¡

slide-18
SLIDE 18

Weighted ¡k-­‑NN ¡

  • Consider ¡the ¡following ¡generaliza@on ¡of ¡the ¡k-­‑NN ¡algorithm ¡(specialized ¡to ¡

binary ¡classifica@on): ¡

  • Weighs ¡the ¡i’th ¡training ¡point’s ¡label ¡by ¡how ¡far ¡xi ¡is ¡from ¡x ¡

ˆ y(~ x) ← sign N X

i=1

yid(~ xi, ~ x) !

d(~ xi, ~ x) = 1 ||~ xi − ~ x||2

2

with ¡

k

d(~ xi, ~ x) = exp ✓ −||~ xi − ~ x||2

2

22 ◆

  • r… ¡
slide-19
SLIDE 19

k-­‑NN ¡is ¡similar ¡to ¡SVM ¡with ¡Gaussian ¡kernel! ¡

  • Consider ¡the ¡following ¡generaliza@on ¡of ¡the ¡k-­‑NN ¡algorithm ¡(specialized ¡to ¡

binary ¡classifica@on): ¡

  • Looks ¡at ¡all ¡training ¡points ¡(i.e., ¡k=N), ¡but ¡weighs ¡the ¡i’th ¡training ¡point’s ¡

label ¡by ¡how ¡far ¡xi ¡is ¡from ¡x ¡

  • Now ¡compare ¡this ¡to ¡classifica@on ¡with ¡SVM ¡and ¡a ¡Gaussian ¡kernel: ¡
  • The ¡discriminant ¡func@ons ¡are ¡nearly ¡iden@cal! ¡The ¡SVM ¡has ¡parameters ¡ ¡

that ¡can ¡be ¡learned ¡

ˆ y(~ x) ← sign N X

i=1

yid(~ xi, ~ x) !

d(~ xi, ~ x) = 1 ||~ xi − ~ x||2

2

with ¡

  • r… ¡ d(~

xi, ~ x) = exp ✓ −||~ xi − ~ x||2

2

22 ◆ ˆ y(~ x) ← sign N X

i=1

↵iyiK(~ xi, ~ x) !

0 ≤ αi ≤ C

αi

slide-20
SLIDE 20

KNN ¡Advantages ¡

  • Easy ¡to ¡program ¡
  • No ¡op@miza@on ¡or ¡training ¡required ¡
  • Classifica@on ¡accuracy ¡can ¡be ¡very ¡good; ¡can ¡
  • utperform ¡more ¡complex ¡models ¡