Large-Scale Visual Recogni2on Jia Deng CS231B 5/21/2013 - - PowerPoint PPT Presentation

large scale visual recogni2on
SMART_READER_LITE
LIVE PREVIEW

Large-Scale Visual Recogni2on Jia Deng CS231B 5/21/2013 - - PowerPoint PPT Presentation

Large-Scale Visual Recogni2on Jia Deng CS231B 5/21/2013 California Roll Ingredients : Rice, Seaweed, Crab, Cucumber, Avocado Calories : 40 Fat : 7g


slide-1
SLIDE 1

Large-­‑Scale ¡Visual ¡Recogni2on ¡

Jia ¡Deng ¡ CS231B ¡ 5/21/2013 ¡

slide-2
SLIDE 2

¡

California ¡Roll ¡

Ingredients: ¡Rice, ¡Seaweed, ¡ Crab, ¡Cucumber, ¡Avocado ¡ Calories: ¡40 ¡ Fat: ¡7g ¡ Carb: ¡40g ¡ Protein: ¡5g ¡ Gluten ¡Free ¡ ¡

slide-3
SLIDE 3

Amanita ¡phalloides ¡ ¡

hHp://en.wikipedia.org/ wiki/Amanita_phalloides ¡ ¡

  • TOXIC. ¡DO ¡NOT ¡EAT ¡

¡

slide-4
SLIDE 4

Mountain ¡Lion ¡

DO ¡NOT ¡RUN ¡ Raise ¡arms ¡to ¡appear ¡larger. ¡ ¡ Show ¡your ¡teeth ¡

slide-5
SLIDE 5

¡

IKEA ¡POANG ¡Chair ¡

ON ¡SALE ¡ $29.00 ¡at ¡ikea.com ¡

¡

slide-6
SLIDE 6

Mornonga ¡ ¡ (Japanese ¡flying ¡squirrel) ¡ ¡

Inhabits ¡sub-­‑alpine ¡forests ¡in ¡Japan. ¡

  • Nocturnal. ¡Eats ¡seeds, ¡fruit, ¡tree ¡leaves ¡

(Wikipedia) ¡

slide-7
SLIDE 7

I ¡wish ¡my ¡computer ¡to ¡recognize ¡EVERYTHING ¡

slide-8
SLIDE 8

RecogniPon ¡ Engine ¡

Surveillance ¡ Robo2cs ¡ Assis2ve ¡tools ¡ Wearable ¡devices ¡ Driverless ¡cars ¡ Mining ¡social ¡media ¡ Image ¡search ¡ Smart ¡photo ¡album ¡

slide-9
SLIDE 9

What ¡can ¡computers ¡already ¡recognize? ¡

slide-10
SLIDE 10
slide-11
SLIDE 11
slide-12
SLIDE 12

What’s ¡the ¡next ¡to ¡work ¡on? ¡ Coffee ¡Mugs! ¡

slide-13
SLIDE 13
slide-14
SLIDE 14
slide-15
SLIDE 15

PASCAL ¡VOC ¡[Everingham ¡et ¡al. ¡2006-­‑2012] ¡

Airplane ¡ Bird ¡ Boat ¡ Bike ¡ BoZle ¡ Bus ¡ Car ¡ Cat ¡ Chair ¡ Cow ¡

¡

Dining ¡table ¡ Dog ¡ Horse ¡ Motorbike ¡ Person ¡ PoZed ¡plant ¡ Sheep ¡ Sofa ¡ Train ¡ TV ¡monitor ¡

¡

No ¡Coffee ¡Mugs! ¡

slide-16
SLIDE 16

The ¡rest ¡of ¡the ¡talk ¡will ¡be ¡about ¡Coffee ¡Mugs! ¡

slide-17
SLIDE 17

What ¡about ¡Gas ¡Pumps! ¡

slide-18
SLIDE 18

The ¡rest ¡of ¡the ¡talk ¡will ¡be ¡about ¡Coffee ¡Mugs ¡ And ¡Gas ¡Pumps ¡ And ¡Solar ¡arrays ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡Radio ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡First ¡aid ¡kit ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Spacesuit ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Oxygen ¡Cylinder ¡ ¡ ¡ ¡ ¡ ¡ ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡

What ¡do ¡they ¡have ¡in ¡common? ¡

slide-19
SLIDE 19

Let’s ¡work ¡on ¡recognizing ¡EVERYTHING ¡

slide-20
SLIDE 20

How ¡many ¡things ¡are ¡there? ¡

3.5M+ ¡

unique ¡tags ¡ ¡

[Sigurbjörnsson ¡& ¡ Zwol ¡’08] ¡

WordNet

80K+ ¡ ¡

English ¡nouns ¡ ¡

[Miller ¡’95; ¡Fellbaum ¡

’98] ¡

60K+ ¡ ¡

product ¡ ¡ categories ¡

4.1M+ ¡

ar2cles ¡

¡ ¡10K+ ¡ ¡

[Biederman ¡’87] ¡

slide-21
SLIDE 21

PASCAL ¡VOC ¡[Everingham ¡et ¡al. ¡2006-­‑2012] ¡

From ¡20 ¡classes ¡to ¡Millions? ¡

slide-22
SLIDE 22
slide-23
SLIDE 23

Big ¡Data ¡from ¡the ¡Internet ¡ ¡

slide-24
SLIDE 24

21 ¡EB ¡ 63 ¡EB ¡ 48 ¡EB ¡ 38 ¡EB ¡ 30 ¡EB ¡

Source: ¡Cisco ¡ ¡

Global ¡Consumer ¡Internet ¡Traffic ¡Per ¡Month ¡

2011 ¡ 2012 ¡ 2013 ¡ 2014 ¡ 2015 ¡ 2016 ¡

83 ¡EB ¡

slide-25
SLIDE 25

83 ¡EB ¡

2016 ¡ Source: ¡Cisco ¡ ¡

Visual ¡ 86% ¡

72 ¡hours ¡of ¡videos ¡/ ¡min ¡ 300 ¡million ¡images ¡/ ¡day ¡

slide-26
SLIDE 26

Big ¡Data ¡from ¡the ¡Internet ¡ ¡ à à ¡The ¡Internet ¡can ¡teach ¡EVERYTHING ¡

slide-27
SLIDE 27

hHp://www.worth1000.com/contests/12705/contest ¡

slide-28
SLIDE 28

What ¡kind ¡of ¡credit ¡card ¡is ¡President ¡Obama ¡ ¡ using ¡in ¡this ¡video ¡of ¡him ¡donaPng ¡to ¡his ¡campaign? ¡

slide-29
SLIDE 29

Big ¡Data ¡

The ¡Internet: ¡Machines ¡+ ¡Crowd ¡

Teach ¡machines ¡to ¡recognize ¡EVERYTHING ¡

slide-30
SLIDE 30

Goal: ¡Build ¡a ¡recogniPon ¡engine ¡on ¡EVERYTHING ¡

10K ¡classes ¡ ¡

¡ ¡10K+ ¡ ¡

[Biederman ¡’87] ¡

PASCAL ¡VOC ¡ 20 ¡

[Everingham ¡et ¡al.’06-­‑’12] ¡

slide-31
SLIDE 31

22K ¡categories ¡and ¡14M ¡images ¡

www.image-­‑net.org ¡ [Deng ¡et ¡al. ¡2009] ¡

  • Animals ¡
  • Bird ¡
  • Fish ¡
  • Mammal ¡
  • Invertebrate ¡

¡

  • Plants ¡
  • Tree ¡
  • Flower ¡
  • Food ¡
  • Materials ¡
  • Structures ¡
  • Ar2fact ¡
  • Tools ¡
  • Appliances ¡
  • Structures ¡
  • Person ¡
  • Scenes ¡
  • Indoor ¡
  • Geological ¡Forma2ons ¡
  • Sport ¡Ac2vi2es ¡

¡

slide-32
SLIDE 32
  • 9 ¡Million ¡images ¡
  • 4 ¡methods ¡

– SPM+SVM ¡[Lazebnik ¡et ¡al. ¡’06] ¡ – BOW+SVM ¡[Csurka ¡et ¡al. ¡’04] ¡ – BOW+NN ¡ – GIST+NN ¡[Oliva ¡et ¡al. ¡’01] ¡ ¡

¡

Learn ¡to ¡Classify ¡10K ¡Classes ¡

Deng, ¡Berg, ¡Li, ¡& ¡Fei-­‑Fei, ¡ECCV2010 ¡

  • 6.4% ¡for ¡10K ¡categories ¡ ¡
slide-33
SLIDE 33

Deng, ¡Berg, ¡Li, ¡& ¡Fei-­‑Fei, ¡ECCV2010 ¡

Learn ¡to ¡Classify ¡10K ¡Classes ¡

slide-34
SLIDE 34

Fine-­‑grained ¡categories ¡are ¡a ¡lot ¡harder ¡

Deng, ¡Berg, ¡Li, ¡& ¡Fei-­‑Fei, ¡ECCV2010 ¡

Vehicle ¡ Ar2fact ¡ En2ty ¡ Vehicle ¡ Ar2fact ¡ En2ty ¡

Finer ¡ Coarser ¡

Average ¡Seman2c ¡Distance ¡

slide-35
SLIDE 35

Ch Chal allen enges es

Fine-grained classes Semantic hierarchy Large-scale Learning

slide-36
SLIDE 36

Bo, ¡the ¡first ¡dog ¡ Portuguese ¡water ¡dog ¡ Dog ¡ Animal ¡ En2ty ¡

Certainty ¡

slide-37
SLIDE 37

Portuguese ¡water ¡dog ¡ Dog ¡ Animal ¡ En2ty ¡

Let’s ¡describe ¡at ¡this ¡level ¡

Bo, ¡the ¡first ¡dog ¡

But ¡it ¡wastes ¡capacity ¡

slide-38
SLIDE 38

Hedging: ¡Be ¡as ¡informaPve ¡as ¡possible ¡with ¡few ¡mistakes ¡ ….. ¡

En2ty ¡

….. ¡

Mammal ¡ Zebra ¡ Kangaroo ¡ Kangaroo ¡ü ¡ Mammal ¡ ü ¡

….. ¡

En2ty ¡

….. ¡

Mammal ¡ Zebra ¡ Kangaroo ¡ Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡

slide-39
SLIDE 39

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ en2ty ¡ mammal ¡ vehicle ¡ kangaroo ¡ zebra ¡ car ¡ boat ¡

Formal ¡Problem ¡Statement ¡ ¡

slide-40
SLIDE 40

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ en2ty ¡ mammal ¡ vehicle ¡ kangaroo ¡ zebra ¡ car ¡ boat ¡ All ¡Correct ¡ ¡

Formal ¡Problem ¡Statement ¡ ¡

slide-41
SLIDE 41

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ en2ty ¡ mammal ¡ vehicle ¡ kangaroo ¡ zebra ¡ car ¡ boat ¡ All ¡Correct ¡ ¡

$0 ¡ $1 ¡ $2 ¡

Formal ¡Problem ¡Statement ¡ ¡

slide-42
SLIDE 42

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡

Maximize

f

R( f ) Subject to A( f ) !1"!

Formal ¡Problem ¡Statement ¡ ¡

AssumpPons ¡

  • Same ¡distribu2on ¡for ¡training ¡and ¡test. ¡
  • A ¡base ¡classifier ¡g ¡that ¡gives ¡posterior ¡probability ¡on ¡the ¡hierarchy. ¡

Goal ¡

  • Find ¡a ¡decision ¡rule ¡f ¡ ¡
  • Expected ¡accuracy ¡A(f) ¡is ¡at ¡least ¡1-­‑ε ¡
  • Maximize ¡expected ¡reward ¡R(f) ¡

posterior ¡for ¡all ¡nodes ¡ g ¡ f ¡ Test ¡image ¡

slide-43
SLIDE 43

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ 0.90 ¡ 1.0 ¡ Pick ¡a ¡global ¡confidence ¡threshold ¡T=0.9 ¡ 0.6 ¡ ¡ 0.90 ¡ 1.0 ¡ 0.80 ¡ ¡

¡[Vailaya ¡et ¡al. ¡’99] ¡

100 ¡images ¡ Another ¡100 ¡images ¡

$0 ¡ $1 ¡ $10 ¡ $2 ¡ $1 ¡ $0 ¡ Reward ¡= ¡ ¡($1 ¡* ¡0.90 ¡+ ¡$1 ¡* ¡0.90) ¡/ ¡2 ¡ ¡= ¡$0.90 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Accuracy ¡= ¡(0.90 ¡+ ¡0.90 ¡) ¡/ ¡2 ¡ ¡ ¡= ¡0.90 ¡ ¡

slide-44
SLIDE 44

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ 0.90 ¡ 1.0 ¡ Pick ¡a ¡global ¡confidence ¡threshold ¡T=0.9 ¡ 0.6 ¡ ¡ 0.90 ¡ 1.0 ¡ 0.80 ¡ ¡

¡[Vailaya ¡et ¡al. ¡’99] ¡

100 ¡images ¡ Another ¡100 ¡images ¡

$0 ¡ $1 ¡ $10 ¡ $2 ¡ $1 ¡ $0 ¡ 0.90 ¡ 1.0 ¡ 0.6 ¡ ¡ 0.90 ¡ 1.0 ¡ 0.80 ¡ ¡

100 ¡images ¡ Another ¡100 ¡images ¡

$0 ¡ $1 ¡ $10 ¡ $2 ¡ $1 ¡ $0 ¡ T=0.95 ¡ T=0.80 ¡ Reward ¡= ¡ ¡($1 ¡* ¡0.90 ¡+ ¡$1 ¡* ¡0.90) ¡/ ¡2 ¡ ¡= ¡$0.90 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Accuracy ¡= ¡(0.90 ¡+ ¡0.90 ¡) ¡/ ¡2 ¡ ¡ ¡= ¡0.90 ¡ ¡ Reward ¡= ¡ ¡($0 ¡* ¡1.0 ¡+ ¡$10 ¡* ¡0.80) ¡/ ¡2 ¡ ¡= ¡$4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Accuracy ¡= ¡(1.0 ¡+ ¡0.80 ¡) ¡/ ¡2 ¡ ¡ ¡= ¡0.90 ¡ ¡

slide-45
SLIDE 45

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡

We ¡can ¡opPmize ¡individual ¡thresholds… ¡ But ¡actually ¡we ¡don’t ¡need ¡to. ¡ There ¡is ¡a ¡simpler ¡and ¡provably ¡opPmal ¡soluPon ¡

T1 ¡ T2 ¡ T3 ¡ T4 ¡ T5 ¡ T6 ¡ T7 ¡

slide-46
SLIDE 46

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡

posterior ¡for ¡all ¡nodes ¡ Expected ¡rewards ¡ Increase ¡each ¡reward ¡by ¡λ ¡

λ ¡

A ¡global, ¡fixed ¡scalar ¡parameter ¡λ≥0 ¡ ¡

Predict ¡the ¡best ¡ Test ¡image ¡

slide-47
SLIDE 47

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ Decision ¡rule ¡f ¡with ¡λ ¡ Pick ¡a ¡λ ¡ Measure ¡ ¡

( ¡on ¡valida2on) ¡

Accuracy ¡ ≈ ¡1-­‑ε? ¡ N Binary ¡search ¡

Theorem: ¡ ¡Under ¡very ¡mild ¡condiPons, ¡this ¡is ¡opPmal. ¡

Accuracy ¡

1-­‑ε ¡ λ ¡

slide-48
SLIDE 48

Deng, ¡Krause, ¡Berg, ¡Fei-­‑Fei, ¡CVPR2012 ¡ Ours ¡ LEAF-­‑GT ¡ MAX-­‑REW ¡ MAX-­‑EXP ¡

slide-49
SLIDE 49

www.image-­‑net.org/eva ¡ ¡

slide-50
SLIDE 50

50 ¡

slide-51
SLIDE 51
slide-52
SLIDE 52
slide-53
SLIDE 53