Boos$ng (almost) by hand (from Rob Schapire) N = 10 - - PowerPoint PPT Presentation

boos ng almost by hand from rob schapire
SMART_READER_LITE
LIVE PREVIEW

Boos$ng (almost) by hand (from Rob Schapire) N = 10 - - PowerPoint PPT Presentation

Boos$ng (almost) by hand (from Rob Schapire) N = 10 Whats error train here? Whats error train here? New weights New weights Step 2 No$ce


slide-1
SLIDE 1

Boos$ng ¡(almost) ¡by ¡hand ¡

slide-2
SLIDE 2
slide-3
SLIDE 3

(from ¡Rob ¡Schapire) ¡

N ¡= ¡10 ¡

slide-4
SLIDE 4

Whats ¡error ¡train ¡here? ¡

slide-5
SLIDE 5

Whats ¡error ¡train ¡here? ¡

slide-6
SLIDE 6

New ¡weights ¡

slide-7
SLIDE 7

New ¡weights ¡

slide-8
SLIDE 8

Step ¡2 ¡

No$ce ¡I ¡s$ll ¡get ¡3 ¡examples ¡wrong, ¡ ¡but ¡they ¡are ¡worth ¡less ¡now. ¡

slide-9
SLIDE 9

New ¡weights ¡

slide-10
SLIDE 10

Step ¡3 ¡

No$ce ¡I ¡s$ll ¡get ¡3 ¡examples ¡ ¡

  • wrong. ¡
slide-11
SLIDE 11
slide-12
SLIDE 12

Evalua$on ¡Metrics ¡

  • 0-­‑1 ¡error ¡on ¡test ¡set: ¡
  • 1 ¡– ¡(0-­‑1 ¡error)/N ¡= ¡accuracy ¡
  • Accuracy ¡is ¡just ¡% ¡of ¡test ¡samples ¡I ¡get ¡right. ¡

¡

slide-13
SLIDE 13

Let’s ¡go ¡back ¡to ¡that ¡millionaire… ¡

  • Let’s ¡say ¡the ¡millionaire ¡asks ¡you ¡to ¡build ¡a ¡

classifier ¡to ¡iden$fy ¡other ¡millionaires. ¡

slide-14
SLIDE 14

Let’s ¡go ¡back ¡to ¡that ¡millionaire… ¡

  • Let’s ¡say ¡the ¡millionaire ¡asks ¡you ¡to ¡build ¡a ¡

classifier ¡to ¡iden$fy ¡other ¡millionaires. ¡

  • You ¡build ¡a ¡fancy ¡classifier, ¡and ¡get ¡accuracy ¡= ¡

80% ¡in ¡some ¡test ¡data. ¡PreZy ¡good, ¡right? ¡

slide-15
SLIDE 15

Let’s ¡go ¡back ¡to ¡that ¡millionaire… ¡

  • Let’s ¡say ¡the ¡millionaire ¡asks ¡you ¡to ¡build ¡a ¡

classifier ¡to ¡iden$fy ¡other ¡millionaires. ¡

  • You ¡build ¡a ¡fancy ¡classifier, ¡and ¡get ¡accuracy ¡= ¡

80% ¡in ¡some ¡test ¡data. ¡PreZy ¡good, ¡right? ¡

  • Your ¡compe$$on ¡has ¡a ¡O(1) ¡classifier ¡that ¡has ¡

accuracy ¡~ ¡99.9%. ¡Should ¡the ¡millionaire ¡fire ¡ you ¡right ¡away? ¡

slide-16
SLIDE 16

Let’s ¡go ¡back ¡to ¡that ¡millionaire… ¡

  • Let’s ¡say ¡the ¡millionaire ¡asks ¡you ¡to ¡build ¡a ¡

classifier ¡to ¡iden$fy ¡other ¡millionaires. ¡

  • You ¡build ¡a ¡fancy ¡classifier, ¡and ¡get ¡accuracy ¡= ¡

80% ¡in ¡some ¡test ¡data. ¡PreZy ¡good, ¡right? ¡

  • Your ¡compe$$on ¡has ¡a ¡O(1) ¡classifier ¡that ¡has ¡

accuracy ¡~ ¡99.9%. ¡Should ¡the ¡millionaire ¡fire ¡ you ¡right ¡away? ¡

  • His ¡classifier ¡just ¡always ¡predicts ¡‘not ¡

millionaire’. ¡

slide-17
SLIDE 17

Confusion ¡matrix ¡

slide-18
SLIDE 18

Confusion ¡matrix ¡

slide-19
SLIDE 19

Examples: ¡

I ¡got ¡this ¡figure ¡from ¡ ¡hZp://www.lucidatainc.com/2012/10/recall-­‑and-­‑precision-­‑understanding-­‑relevancy-­‑in-­‑ ediscovery/ ¡

Let’s ¡say ¡the ¡net ¡is ¡ trying ¡to ¡pick ¡only ¡ blue ¡fish. ¡What’s ¡ the ¡precision ¡and ¡ the ¡recall? ¡

slide-20
SLIDE 20

Examples: ¡

I ¡got ¡this ¡figure ¡from ¡ ¡hZp://www.lucidatainc.com/2012/10/recall-­‑and-­‑precision-­‑understanding-­‑relevancy-­‑in-­‑ ediscovery/ ¡

Let’s ¡say ¡the ¡net ¡is ¡ trying ¡to ¡pick ¡only ¡ blue ¡fish. ¡What’s ¡ the ¡precision ¡and ¡ the ¡recall? ¡ P ¡= ¡1/4 ¡ R ¡= ¡1/5 ¡ ¡

slide-21
SLIDE 21

Examples: ¡

I ¡got ¡this ¡figure ¡from ¡ ¡hZp://www.lucidatainc.com/2012/10/recall-­‑and-­‑precision-­‑understanding-­‑relevancy-­‑in-­‑ ediscovery/ ¡

Let’s ¡say ¡the ¡net ¡is ¡ trying ¡to ¡pick ¡only ¡ red ¡fish. ¡What’s ¡ the ¡precision ¡and ¡ the ¡recall? ¡

slide-22
SLIDE 22

Examples: ¡

I ¡got ¡this ¡figure ¡from ¡ ¡hZp://www.lucidatainc.com/2012/10/recall-­‑and-­‑precision-­‑understanding-­‑relevancy-­‑in-­‑ ediscovery/ ¡

Let’s ¡say ¡the ¡net ¡is ¡ trying ¡to ¡pick ¡only ¡ red ¡fish. ¡What’s ¡ the ¡precision ¡and ¡ the ¡recall? ¡ P ¡= ¡3/4 ¡ R ¡= ¡3/5 ¡ ¡

slide-23
SLIDE 23

A ¡single ¡metric? ¡

  • F1 ¡ ¡= ¡2 ¡* ¡precision ¡* ¡recall ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡precision ¡+ ¡recall ¡

  • Fbeta ¡
  • AUC ¡
  • … ¡

¡

slide-24
SLIDE 24

Which ¡one ¡is ¡beZer? ¡

  • Our ¡millionaire ¡iden$fica$on ¡scenario? ¡
slide-25
SLIDE 25

Which ¡one ¡is ¡beZer? ¡

  • Spam ¡classifica$on ¡
slide-26
SLIDE 26

Which ¡one ¡is ¡beZer? ¡

  • Medical ¡classifier: ¡Y ¡= ¡(operate, ¡don’t ¡operate) ¡
slide-27
SLIDE 27

Which ¡one ¡is ¡beZer? ¡

  • Search ¡engine: ¡query ¡= ¡legal ¡
slide-28
SLIDE 28

Which ¡one ¡is ¡beZer? ¡

  • Search ¡engine: ¡query ¡= ¡“Husky ¡football” ¡
  • By ¡the ¡way: ¡why ¡does ¡google ¡show ¡more ¡than ¡

1 ¡page? ¡

slide-29
SLIDE 29

Which ¡one ¡is ¡beZer? ¡

  • It ¡depends ¡on ¡the ¡task ¡
  • Is ¡there ¡imbalance? ¡
  • Are ¡the ¡misclassifica$on ¡costs ¡the ¡same? ¡
  • … ¡
  • … ¡
  • Think ¡about ¡evalua$on ¡when ¡doing ¡your ¡

projects! ¡