A Unified Framework for Mul4- Target Tracking and Collec4ve - - PowerPoint PPT Presentation

a unified framework for mul4 target tracking and
SMART_READER_LITE
LIVE PREVIEW

A Unified Framework for Mul4- Target Tracking and Collec4ve - - PowerPoint PPT Presentation

A Unified Framework for Mul4- Target Tracking and Collec4ve Ac4vity Recogni4on Wong Choi and Silvio Savarese Presented by: David J. Garcia November 9,


slide-1
SLIDE 1

A ¡Unified ¡Framework ¡for ¡Mul4-­‑ Target ¡Tracking ¡and ¡Collec4ve ¡ Ac4vity ¡Recogni4on ¡

¡ Wong ¡Choi ¡and ¡Silvio ¡Savarese ¡

Presented ¡by: ¡David ¡J. ¡Garcia ¡ November ¡9, ¡2012 ¡ ¡ ¡ ¡ ¡

slide-2
SLIDE 2

Organiza4on ¡

  • Introduc4on ¡and ¡Problem ¡Descrip4on ¡
  • Contribu4ons ¡
  • Technical ¡Details ¡
  • Experiments ¡
  • Conclusions ¡and ¡Extensions ¡
  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡hWp://www-­‑personal.umich.edu/~wgchoi/eccv12/wongun_eccv12.html ¡

slide-3
SLIDE 3

Introduc4on ¡and ¡Problem ¡Descrip4on ¡

  • ­‑ Consider ¡the ¡following ¡scenes. ¡ ¡What ¡labels ¡would ¡

you ¡aWach ¡to ¡the ¡“ac4vi4es” ¡in ¡them? ¡

slide-4
SLIDE 4

Introduc4on ¡and ¡Problem ¡Descrip4on ¡

  • ­‑ In ¡this ¡image, ¡perhaps ¡the ¡people ¡are ¡“standing ¡in ¡a ¡

line?” ¡

slide-5
SLIDE 5

Introduc4on ¡and ¡Problem ¡Descrip4on ¡

  • ­‑ Maybe ¡this ¡one ¡is ¡a ¡talking ¡scene? ¡
slide-6
SLIDE 6

Introduc4on ¡and ¡Problem ¡Descrip4on ¡

  • ­‑ What ¡about ¡these ¡two? ¡ ¡They ¡seem ¡similar ¡in ¡some ¡

ways ¡(a ¡group ¡of ¡people ¡focused ¡inward). ¡

  • ­‑

Maybe ¡one ¡group ¡is ¡converging, ¡and ¡maybe ¡the ¡other ¡is ¡simply ¡wai4ng? ¡ ¡ It’s ¡difficult ¡to ¡tell ¡without ¡more ¡informa4on. ¡ ¡Video ¡might ¡be ¡able ¡to ¡add ¡ addi4onal ¡informa4on. ¡

slide-7
SLIDE 7

Introduc4on ¡and ¡Problem ¡Descrip4on ¡

  • ­‑ To ¡infer ¡an ¡ac4vity ¡in ¡a ¡video ¡scene…track ¡subjects ¡and ¡infer ¡

pairwise ¡ac4vi4es. ¡

  • ­‑ Problems ¡addressed ¡simultaneously ¡with ¡a ¡hierarchical ¡

graphical ¡model. ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡hWp://www-­‑personal.umich.edu/~wgchoi/eccv12/wongun_eccv12.html ¡

slide-8
SLIDE 8

Contribu4ons ¡

  • ­‑ Graphical ¡model ¡that ¡correlates ¡collec4ve ¡ac4vity, ¡pairwise ¡

ac4vity ¡and ¡individual ¡ac4vity ¡in ¡a ¡hierarchical ¡fashion. ¡

  • ­‑ Simultaneously ¡solving ¡the ¡tracking ¡problem ¡and ¡the ¡ac4vity ¡

inference ¡problem: ¡The ¡tracking ¡problem ¡is ¡solved ¡with ¡help ¡ from ¡annotated ¡data. ¡

  • ­‑ Solving ¡this ¡“joint ¡inference ¡problem” ¡with ¡a ¡novel ¡algorithm ¡

that ¡combines ¡belief ¡propaga4on ¡and ¡the ¡branch ¡and ¡bound ¡

  • algorithm. ¡
  • ­‑ The ¡authors ¡also ¡evaluate ¡their ¡method ¡against ¡challenging ¡
  • datasets. ¡
  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡hWp://www-­‑personal.umich.edu/~wgchoi/eccv12/wongun_eccv12.html ¡

slide-9
SLIDE 9

Technical ¡Details: ¡Ac4vity ¡Modeling ¡

¡ ¡Collec4ve-­‑Ac4vity: ¡C ¡(Oc ¡is ¡called ¡the ¡crowd ¡context ¡descriptor) ¡

¡Pairwise-­‑Ac4vity: ¡I ¡(i ¡and ¡j ¡are ¡the ¡individual ¡subjects ¡in ¡the ¡interac4on) ¡ ¡Individual-­‑Ac4vity: ¡A ¡(Oi ¡are ¡the ¡“appearance ¡features” ¡of ¡subject ¡i) ¡

¡ ¡These ¡include ¡features ¡like ¡HoG ¡[3] ¡and ¡BoV ¡[4] ¡ ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡hWp://www-­‑personal.umich.edu/~wgchoi/eccv12/wongun_eccv12.html ¡

  • ­‑

[3] ¡Dalal, ¡N., ¡Triggs, ¡B.: ¡Histograms ¡of ¡oriented ¡gradients ¡for ¡human ¡detec4on. ¡CVPR. ¡2005 ¡

  • ­‑

[4] ¡Dollar, ¡P., ¡Rabaud, ¡V., ¡CoWrell, ¡G., ¡Belongie, ¡S. ¡Behavior ¡recogni4on ¡via ¡sparse ¡spa4o-­‑temporal ¡features. ¡VS-­‑PETS. ¡2005 ¡

slide-10
SLIDE 10

Technical ¡Details: ¡Collec4ve ¡Observa4ons…the ¡ STL ¡descriptor ¡

  • The ¡spa4o-­‑temporal ¡local ¡(STL) ¡descriptor ¡

is ¡a ¡binning-­‑style ¡descriptor. ¡

  • An ¡“anchor” ¡is ¡chosen ¡(indicated ¡in ¡blue). ¡
  • The ¡loca4on ¡(and ¡pose) ¡of ¡every ¡other ¡

person ¡is ¡noted ¡and ¡placed ¡into ¡a ¡bin ¡ rela4ve ¡to ¡the ¡anchor. ¡

  • These ¡histograms ¡are ¡“stacked” ¡along ¡the ¡

4me ¡dimension.. ¡

  • For ¡more ¡informa4on, ¡please ¡see ¡[3] ¡and ¡[4] ¡
  • Side ¡Note: ¡Almost ¡like ¡“leWer” ¡recogni4on? ¡

¡

¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡hWp://www-­‑personal.umich.edu/~wgchoi/eccv12/wongun_eccv12.html ¡

  • ­‑

[3] ¡W. ¡Choi, ¡S. ¡K. ¡Savarese. ¡What ¡are ¡they ¡doing?: ¡Collec4ve ¡ac4vity ¡classifica4on ¡using ¡spa4o-­‑temporal ¡ rela4onship ¡among ¡people. ¡VSWS ¡2009 ¡

  • ­‑

[4] ¡W. ¡Choi, ¡S. ¡K. ¡Savarese. ¡Learning ¡context ¡for ¡collec4ve ¡ac4vity ¡recogni4on. ¡CVPR ¡2011 ¡

slide-11
SLIDE 11

Technical ¡Details: ¡Tracking ¡Problem ¡

  • ­‑

Although ¡it’s ¡assumed ¡that ¡only ¡one ¡collec4ve ¡ac4vity ¡is ¡present ¡in ¡any ¡

  • ne ¡scene(mul4ple ¡frames), ¡mul4ple ¡subjects ¡need ¡to ¡be ¡tracked. ¡
  • ­‑

The ¡tracklet ¡associa4on ¡problem ¡can ¡be ¡understood ¡as ¡a ¡matching ¡

  • problem. ¡
  • ­‑

The ¡best ¡associa4on ¡is ¡the ¡one ¡of ¡LEAST ¡resistance… ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

slide-12
SLIDE 12

Technical ¡Details: ¡Combining ¡Everything ¡

  • ­‑

This ¡track ¡associa4on ¡is ¡not ¡good ¡if ¡this ¡is ¡a ¡crossing ¡ac4vity. ¡

  • ­‑

[1]W. ¡Choi, ¡S. ¡Savarese. ¡Slides: ¡hWp://www.umich.edu/~wgchoi/eccv12/choi_eccv12_final_web.pptx ¡

  • ­‑

[2] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

𝛺(𝐷, ¡𝐽, ¡𝐵, ¡𝑃, ¡𝑔) ¡= 𝛺(𝐵, ¡𝑃)+𝛺(𝐽, ¡𝐵, ¡𝑔) ¡+ ¡𝛺(𝐷, ¡𝐽)+𝛺(𝐷, ¡𝑃) ¡+ 𝛺(𝐷)+𝛺(𝐽)+𝛺(𝐵)− ¡​𝑑↑𝑈 𝑔, ¡𝑔∈𝑻 ¡

Tracking ¡

Crossing ¡

slide-13
SLIDE 13

Technical ¡Details: ¡Combining ¡Everything ¡

  • ­‑

This ¡is ¡a ¡much ¡beWer ¡associa4on. ¡

  • ­‑

[1]W. ¡Choi, ¡S. ¡Savarese. ¡Slides: ¡hWp://www.umich.edu/~wgchoi/eccv12/choi_eccv12_final_web.pptx ¡

  • ­‑

[2] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

𝛺(𝐷, ¡𝐽, ¡𝐵, ¡𝑃, ¡𝑔) ¡= 𝛺(𝐵, ¡𝑃)+𝛺(𝐽, ¡𝐵, ¡𝑔) ¡+ ¡𝛺(𝐷, ¡𝐽)+𝛺(𝐷, ¡𝑃) ¡+ 𝛺(𝐷)+𝛺(𝐽)+𝛺(𝐵)− ¡​𝑑↑𝑈 𝑔, ¡𝑔∈𝑻 ¡

Tracking ¡

Crossing ¡

slide-14
SLIDE 14

Technical ¡Details: ¡Classifica4on ¡+ ¡? ¡+ ¡Tracking ¡= ¡Profit ¡!!! ¡

  • ­‑

The ¡two ¡problems ¡combined ¡as ¡a ¡maximiza4on ¡of ¡the ¡following: ¡

  • ­‑

Sec4on ¡3 ¡dealt ¡with ¡the ¡classifica4on ¡bit. ¡

  • ­‑

Sec4on ¡4 ¡defined ¡the ¡tracking ¡problem. ¡ ¡

  • ­‑

Note ¡that ¡‘f’ ¡is ¡incorporated ¡in ¡both ¡terms. ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

slide-15
SLIDE 15

Technical ¡Details: ¡Divide ¡and ¡Conquer ¡

  • ­‑

The ¡compact ¡equa4on ¡on ¡the ¡previous ¡slide ¡is ¡broken ¡up ¡into ¡two ¡problems ¡and ¡ solved ¡itera4vely. ¡ ¡ ¡

¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡Choi, ¡W., ¡Savarese, ¡S.: ¡Supplementary ¡material. ¡In: ¡ECCV. ¡(2012) ¡

Hold ¡f ¡constant, ¡and ¡solve ¡via ¡Belief ¡

  • Propaga4on. ¡ ¡Obtain ¡‘I’ ¡and ¡‘A’ ¡

With ¡‘I’ ¡and ¡‘A’, ¡find ¡f ¡with ¡Branch-­‑and-­‑ Bound ¡algorithm[2]. ¡

slide-16
SLIDE 16

Experiments ¡

  • ­‑

Video-­‑words ¡are ¡obtained ¡by ¡applying ¡PCA ¡(principal ¡component ¡analysis) ¡ with ¡200 ¡dimensions ¡and ¡using ¡K-­‑means ¡with ¡100 ¡code ¡words ¡on ¡the ¡ cuboids ¡described ¡in ¡[2]. ¡

  • ­‑

Collec4ve ¡ac4vity ¡features ¡are ¡computed ¡using ¡STL ¡on ¡tracklets[3]. ¡

  • ­‑

Presumably, ¡tracklets ¡are ¡obtained ¡with ¡[4]. ¡

  • ­‑

STL ¡set ¡for ¡8 ¡meters ¡and ¡60 ¡frames ¡for ¡reinforcement. ¡

  • ­‑

Experiments ¡are ¡done ¡over ¡two ¡datasets. ¡

¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡Dollar, ¡P., ¡Rabaud, ¡V., ¡CoWrell, ¡G., ¡Belongie, ¡S. ¡Behavior ¡recogni4on ¡via ¡sparse ¡spa4o-­‑temporal ¡features. ¡VS-­‑

  • PETS. ¡2005 ¡
  • ­‑

[3] ¡W. ¡Choi, ¡S. ¡K. ¡Savarese. ¡What ¡are ¡they ¡doing?: ¡Collec4ve ¡ac4vity ¡classifica4on ¡using ¡spa4o-­‑temporal ¡ rela4onship ¡among ¡people. ¡VSWS ¡2009 ¡

  • ­‑

[4] ¡Choi, ¡W., ¡Savarese, ¡S.: ¡Mul4ple ¡target ¡tracking ¡in ¡world ¡coordinate ¡with ¡single, ¡minimally ¡calibrated ¡camera. ¡In: ¡

  • ECCV. ¡(2010) ¡
slide-17
SLIDE 17

Experiments: ¡Dataset ¡One ¡

  • ­‑

First ¡dataset ¡is ¡composed ¡of ¡44 ¡video ¡clips ¡with ¡annota4ons ¡for ¡5 ¡collec4ve ¡ ac4vi4es ¡(crossing, ¡wai4ng, ¡queuing, ¡walking, ¡and ¡talking) ¡and ¡8 ¡poses ¡(right, ¡right-­‑ front,…, ¡right ¡back). ¡ ¡8 ¡types ¡of ¡interac4ons ¡are ¡annotated: ¡

  • ­‑

AP ¡(approaching) ¡

  • ­‑

LV ¡(leaving) ¡

  • ­‑

PB ¡(passing-­‑by) ¡

  • ­‑

FE ¡(facing-­‑each-­‑other) ¡

  • ­‑

WS ¡(walking-­‑side-­‑by-­‑side) ¡

  • ­‑

SR ¡(standing-­‑in-­‑a-­‑row) ¡

  • ­‑

SS ¡(standing-­‑side-­‑by-­‑side) ¡

  • ­‑

NA ¡(no ¡interac4ons) ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡]W. ¡Choi, ¡S. ¡Savarese. ¡Slides: ¡hWp://www.umich.edu/~wgchoi/eccv12/choi_eccv12_final_web.pptx ¡

Crossing ¡ Wai4ng ¡ Queuing ¡ Walking ¡ Talking ¡

slide-18
SLIDE 18

Experiments: ¡Dataset ¡Two ¡

  • ­‑

Second ¡dataset ¡is ¡composed ¡of ¡32 ¡video ¡clips ¡with ¡annota4ons ¡for ¡6 ¡collec4ve ¡ac4vi4es ¡ (gathering, ¡talking, ¡dismissal, ¡walking, ¡together, ¡chasing, ¡queueing) ¡and ¡8 ¡poses ¡(right, ¡right-­‑ front,…, ¡right ¡back). ¡ ¡9 ¡types ¡of ¡interac4ons ¡are ¡annotated: ¡

  • ­‑

AP ¡(approaching) ¡

  • ­‑

WO ¡(walking-­‑in-­‑opposite-­‑direc4on) ¡

  • ­‑

WR ¡(walking-­‑one-­‑ater-­‑the-­‑other) ¡

  • ­‑

RS ¡(running-­‑side-­‑by-­‑side) ¡

  • ­‑

RR ¡(running-­‑one-­‑ater-­‑the-­‑other) ¡

  • ­‑

FE ¡(facing-­‑each-­‑other) ¡

  • ­‑

WS ¡(walking-­‑side-­‑by-­‑side) ¡

  • ­‑

SR ¡(standing-­‑in-­‑a-­‑row) ¡

  • ­‑

NA ¡(no ¡interac4ons) ¡

¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡]W. ¡Choi, ¡S. ¡Savarese. ¡Slides: ¡hWp://www.umich.edu/~wgchoi/eccv12/choi_eccv12_final_web.pptx ¡

Gathering ¡ Talking ¡ Dismissal ¡ Walking-­‑ together ¡ Chasing ¡ Queuing ¡

slide-19
SLIDE 19

Experiments: ¡Dataset ¡One ¡for ¡Classifica4on ¡

  • ­‑

Accuracy ¡measure ¡show ¡significant ¡improvement ¡for ¡the ¡method ¡

  • ­‑

The ¡numbers ¡on ¡top ¡are ¡mean-­‑accuracy ¡per ¡class, ¡and ¡overall ¡accuracy. ¡

  • ­‑

The ¡basic ¡SVM ¡isn’t ¡terrible ¡and ¡much ¡simpler ¡to ¡do. ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

slide-20
SLIDE 20

Experiments: ¡Dataset ¡Two ¡for ¡Classifica4on ¡

  • ­‑

Dataset ¡two ¡also ¡shows ¡improvement ¡over ¡the ¡baseline ¡

  • ­‑

The ¡numbers ¡on ¡top ¡are ¡mean-­‑accuracy ¡per ¡class, ¡and ¡overall ¡accuracy. ¡

  • ­‑

What ¡do ¡the ¡“Gathering” ¡and ¡“Dissmissal” ¡ac4vi4es ¡have ¡in ¡common? ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

Gathering ¡ Dismissal ¡

slide-21
SLIDE 21

Experiments: ¡Graphical ¡Model ¡Experiments ¡

  • ­‑

Is ¡the ¡graphical ¡model ¡correct? ¡ ¡The ¡authors ¡test ¡different ¡versions: ¡

  • ­‑

The ¡authors ¡cut ¡some ¡of ¡these ¡links ¡and ¡ see ¡what ¡happens ¡to ¡classifica4on ¡accuracy. ¡

  • ­‑

The ¡Collec4ve ¡observa4ons ¡are ¡clearly ¡the ¡most ¡

  • important. ¡
  • ­‑

Baseline: ¡SVM ¡over ¡Collec4ve ¡ac4vity ¡observa4ons ¡(i.e. ¡STL[2]). ¡

¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡W. ¡Choi, ¡S. ¡K. ¡Savarese. ¡What ¡are ¡they ¡doing?: ¡Collec4ve ¡ac4vity ¡classifica4on ¡using ¡spa4o-­‑temporal ¡rela4onship ¡among ¡people. ¡VSWS ¡ 2009 ¡

slide-22
SLIDE 22

Experiments: ¡Temporal ¡Support’s ¡effect ¡on ¡Classifica4on ¡

  • ­‑

What ¡is ¡the ¡sensi4vity ¡of ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡and ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡to ¡the ¡temporal ¡support ¡ window? ¡ ¡The ¡authors ¡isolate ¡each ¡window ¡and ¡test ¡different ¡sizes. ¡

  • ­‑

Authors ¡claim ¡that ¡classifica4on ¡becomes ¡more ¡robust. ¡ ¡Perhaps ¡for ¡collec4ve ¡ ac4vity ¡more ¡so ¡than ¡for ¡pairwise-­‑inference? ¡ ¡How ¡conclusive ¡are ¡these ¡results? ¡ ¡ ¡

  • ­‑

These ¡values ¡directly ¡affect ¡the ¡“cuboid” ¡based ¡features[2]. ¡ ¡Perhaps ¡some ¡ windows ¡are ¡beWer ¡for ¡par4cular ¡ac4vi4es. ¡

  • ­‑

[1] ¡W. ¡Choi, ¡S. ¡Savarese. ¡A ¡Unified ¡Framework ¡for ¡Mul4-­‑Target ¡Tracking ¡and ¡Collec4ve ¡Ac4vity ¡Recogni4on ¡

  • ­‑

[2] ¡Dollar, ¡P., ¡Rabaud, ¡V., ¡CoWrell, ¡G., ¡Belongie, ¡S.: ¡Behavior ¡recogni4on ¡via ¡sparse ¡spa4o-­‑temporal ¡features. ¡In: ¡VS-­‑PETS. ¡(2005) ¡

slide-23
SLIDE 23

Conclusions/Extensions ¡

  • ­‑ Graphical ¡model ¡links ¡that ¡seemed ¡most ¡important ¡were ¡Collec4ve-­‑

Observa4ons ¡link ¡and ¡the ¡temporal ¡link ¡between ¡collec4ve ¡ac4vi4es. ¡

  • ­‑ Is ¡the ¡s4ll ¡camera ¡assump4on ¡reasonable ¡(maybe ¡for ¡some ¡

applica4ons)? ¡ ¡This ¡stems ¡from ¡the ¡‘cuboid’ ¡[1]. ¡

  • ­‑ Authors ¡suggest ¡a ¡mul4-­‑ac4vity ¡detector ¡as ¡a ¡possible ¡extension. ¡
  • ­‑ Finer ¡grained ¡temporal ¡considera4ons ¡(like ¡different ¡temporal ¡

windows ¡for ¡different ¡ac4vi4es) ¡

  • ­‑

[1] ¡Dollar, ¡P., ¡Rabaud, ¡V., ¡CoWrell, ¡G., ¡Belongie, ¡S.: ¡Behavior ¡recogni4on ¡via ¡sparse ¡spa4o-­‑temporal ¡features. ¡In: ¡VS-­‑PETS. ¡(2005) ¡

slide-24
SLIDE 24

Detec4ng ¡Ac4ons, ¡Poses, ¡and ¡Objects ¡with ¡ Rela4onal ¡Phraselets ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡

  • ­‑

Person-­‑Object ¡“composites” ¡are ¡combined ¡“into ¡local ¡patches ¡or ¡‘phraselets.’” ¡

  • ­‑

Phraselets ¡are ¡then ¡used ¡for ¡learning ¡ater ¡a ¡clustering ¡step. ¡

  • ­‑

There ¡are ¡separate ¡“mixtures ¡for ¡visible ¡and ¡occluded ¡parts.” ¡

  • ­‑

[1] ¡C. ¡Desai. ¡D. ¡Ramanan. ¡Detec4ng ¡Ac4ons, ¡Poses, ¡and ¡Objects ¡with ¡Rela4onal ¡Phraselets ¡

slide-25
SLIDE 25

Learning ¡realis4c ¡human ¡ac4ons ¡from ¡movies ¡

  • ­‑

Movies ¡used ¡to ¡train ¡SVM ¡to ¡detect ¡ac4ons. ¡

  • ­‑

Scripts ¡are ¡used ¡to ¡aid ¡in ¡ac4on ¡annota4on. ¡

  • ­‑

Spa4al-­‑Temporal ¡features ¡are ¡extracted ¡for ¡the ¡ sequences/subsequences. ¡

  • ­‑

SVM ¡is ¡trained ¡on ¡clustered ¡BoF ¡data-­‑points. ¡

  • ­‑

KTH ¡dataset ¡evalua4on[2]. ¡

  • ­‑

[1] ¡I. ¡Laptev, ¡M. ¡Marszalek, ¡C. ¡Schmid, ¡B. ¡Rozenfeld. ¡Learning ¡realis4c ¡human ¡ac4ons ¡from ¡movies ¡

  • ­‑

[2] ¡C. ¡Schuldt, ¡I. ¡Laptev, ¡and ¡B. ¡Caputo. ¡Recognizing ¡human ¡ac4ons: ¡A ¡local ¡SVM ¡approach. ¡In ¡ICPR, ¡2004. ¡