overfeat
play

OverFeat Integrated Recogni.on, Localiza.on and Detec.on - PowerPoint PPT Presentation

OverFeat Integrated Recogni.on, Localiza.on and Detec.on using Convolu.onal Networks Sermanet et. al Presenta.on by Eric Holmdahl Roadmap 1. Goal 2. Background


  1. OverFeat ¡ Integrated ¡Recogni.on, ¡Localiza.on ¡and ¡Detec.on ¡using ¡ Convolu.onal ¡Networks ¡ Sermanet ¡et. ¡al ¡ Presenta.on ¡by ¡Eric ¡Holmdahl ¡

  2. Roadmap ¡ 1. Goal ¡ 2. Background ¡ 3. Related ¡Work ¡ 4. Algorithm ¡Overview ¡ 5. Breakdown ¡By ¡Task ¡ 1. Classifica.on ¡ 2. Localiza.on ¡ 3. Detec.on ¡

  3. Goal ¡ Perform ¡classifica.on, ¡localiza.on, ¡and ¡ detec.on ¡on ¡the ¡ImageNet ¡Dataset ¡

  4. Classi3ication ¡ Determining ¡what ¡is ¡the ¡main ¡object ¡in ¡an ¡image ¡

  5. Localization ¡ • Determining ¡where ¡an ¡object ¡is ¡located ¡in ¡an ¡image ¡

  6. Detection ¡ • Performing ¡localiza.on ¡for ¡all ¡objects ¡present ¡in ¡an ¡image ¡

  7. Background: ¡Feed ¡Forward ¡Neural ¡ Networks ¡

  8. Background: ¡Convolutional ¡Nets ¡ • Alterna.ng ¡convolu.on ¡and ¡max ¡pooling ¡layers ¡feed ¡into ¡fully ¡ connected ¡neural ¡net ¡ • Max ¡pooling: ¡with ¡window ¡size ¡kxk, ¡outputs ¡highest ¡intensity ¡value ¡ in ¡window ¡size ¡ • Convolu.on: ¡Scanning ¡window, ¡shared ¡weights ¡within ¡window ¡

  9. ¡ ¡ Related ¡Work ¡

  10. Krizhevsky ¡et. ¡Al: ¡ ImageNet ¡ Classi-ication ¡With ¡Deep ¡Convolutional ¡ Neural ¡Networks ¡

  11. Review: ¡Krizhevsky ¡ Architecture ¡ • Large ¡CNNs ¡used ¡to ¡densely ¡process ¡images ¡with ¡overlapping ¡ windows ¡ • ReLU ¡Nonlinear ¡neuron ¡output ¡ • DropOut ¡

  12. Krizhevksy ¡Results ¡ • Brought ¡CNNs ¡to ¡forefront ¡of ¡classifica.on/localiza.on/ detec.on ¡problem ¡

  13. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡With ¡ Deep ¡Convolutional ¡Networks ¡ ¡

  14. Giusti ¡Fast ¡Scanning ¡ • Problem: ¡CNNs ¡perform ¡a ¡great ¡deal ¡of ¡ redundant ¡compu.ng ¡of ¡convolu.ons ¡ due ¡to ¡overlapping ¡patches ¡ • Solu.on: ¡Apply ¡convolu.on ¡to ¡en.re ¡ image ¡at ¡once! ¡

  15. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡ With ¡Deep ¡Convolutional ¡Networks ¡ Convolu.onal ¡Layer: ¡ ¡ ¡ ¡ ¡ ¡ Max ¡Pooling ¡Layer: ¡

  16. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡ With ¡Deep ¡Convolutional ¡Networks ¡ ¡

  17. Giusti ¡et. ¡al: ¡Results ¡ Provides ¡massive ¡improvements ¡in ¡speed ¡for ¡sliding ¡window ¡CNNs! ¡

  18. Algorithm ¡Overview ¡

  19. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  20. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  21. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  22. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡ • Input: ¡Images ¡with ¡classifica.on ¡and ¡bounding ¡box ¡ • Training ¡objec.ve: ¡Minimize ¡l2 ¡norm ¡between ¡ generated ¡bounding ¡box ¡and ¡ground ¡truth ¡ • One ¡regressor ¡generated ¡for ¡each ¡possible ¡image ¡ class ¡ • Output: ¡(x,y) ¡coordinates ¡of ¡top ¡le[, ¡top ¡right ¡corner ¡ of ¡bounding ¡box ¡ ¡ ¡

  23. Algorithm ¡Overview: ¡Runtime ¡ 1. ¡Perform ¡classifica.on ¡at ¡each ¡loca.on ¡using ¡trained ¡CNN ¡ ¡

  24. Algorithm ¡Overview: ¡Runtime ¡ 2. ¡Perform ¡localiza.on ¡on ¡all ¡classified ¡regions ¡generated ¡by ¡classifier ¡

  25. Algorithm ¡Overview: ¡Runtime ¡ 3. ¡Merge ¡bounding ¡boxes ¡with ¡sufficient ¡overlap ¡from ¡localiza.on ¡and ¡ sufficient ¡confidence ¡of ¡being ¡same ¡object ¡from ¡classifier ¡

  26. Breakdown ¡By ¡Task ¡

  27. Classi3ication ¡

  28. OverFeat ¡Feature ¡Extraction ¡ • First ¡5 ¡layers ¡of ¡Deep ¡Convolu.onal ¡Neural ¡Net: ¡similar ¡to ¡ Krizhevsky’s ¡ • Images ¡downsampled ¡to ¡256x256 ¡ • No ¡contrast ¡normaliza.on, ¡non-­‑overlapping ¡pooling ¡

  29. OverFeat ¡Classi3ication: ¡Dense ¡ Sliding ¡Window ¡

  30. Multi-­‑Scale ¡Classi3ication ¡ • Classifica.on ¡performed ¡at ¡6 ¡scales ¡at ¡test ¡.me, ¡but ¡only ¡1 ¡ scale ¡at ¡run.me ¡ • Increases ¡robustness ¡of ¡model ¡

  31. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● Single output: ○ 1x1 output ○ no feature space ○ blue: feature maps ○ green: operation kernel ○ typical training setup OverFeat • Pierre Sermanet • New York University

  32. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● Multiple outputs: ○ 2x2 output ○ input stride 2x2 ○ recompute only extra yellow areas OverFeat • Pierre Sermanet • New York University

  33. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● With feature space ○ 3 input channels ○ 4 feature maps ○ 2 feature maps ○ 4 feature maps ○ 2 outputs (e.g. 2-class classifier) OverFeat • Pierre Sermanet • New York University

  34. Classi3ication: ¡Results ¡

  35. Localization ¡

  36. Training ¡Localizer ¡ • Use ¡same ¡first ¡5 ¡layers ¡as ¡trained ¡classifier ¡ • Remove ¡fully ¡connected ¡layers, ¡replace ¡with ¡regressor ¡ • Train ¡again ¡on ¡labeled ¡input ¡with ¡bounding ¡boxes ¡

  37. Localization: ¡Fully ¡Connected ¡ Layers ¡

  38. Localization: ¡Bounding ¡Boxes ¡ Produced ¡By ¡Regression ¡

  39. Localization: ¡Combing ¡ Predictions ¡ Algorithm: ¡

  40. Localization: ¡Results ¡

  41. Detection ¡

  42. ImageNet Challenge 2013 ● Detection: ○ 200 classes ○ Smaller objects than classification/localization ○ Any number of objects (including zero) ○ Penalty for false positives OverFeat • Pierre Sermanet • New York University

  43. Differences ¡Between ¡Detection ¡ and ¡Location ¡ • Can ¡now ¡have ¡many ¡objects ¡instead ¡of ¡just ¡ one ¡ • Penalized ¡for ¡incorrect ¡guesses ¡ • Need ¡to ¡dis.nguish ¡background ¡from ¡ objects ¡

  44. Training ¡Detector ¡ • Almost ¡iden.cal ¡to ¡classifica.on/ localiza.on ¡training ¡ • New ¡class ¡added ¡– ¡background ¡ • Background ¡class ¡updated ¡on ¡the ¡fly: ¡ extremely ¡incorrect ¡classifica.ons ¡are ¡ used ¡to ¡train ¡background ¡class ¡

  45. Detection ¡Results ¡

  46. Conclusion ¡ OverFeat ¡provides ¡a ¡way ¡to ¡extract ¡powerful ¡CNN ¡based ¡ features ¡for ¡image ¡classifica.on, ¡localiza.on ¡and ¡detec.on ¡with ¡ high ¡speed ¡and ¡precision ¡

  47. Thanks! ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend