Re-presen(ng Art Collec(ons Joon Son Chung, Relja - - PowerPoint PPT Presentation

re presen ng art collec ons
SMART_READER_LITE
LIVE PREVIEW

Re-presen(ng Art Collec(ons Joon Son Chung, Relja - - PowerPoint PPT Presentation

Re-presen(ng Art Collec(ons Joon Son Chung, Relja Arandjelovi, Giles Bergel, Alex Franklin and Andrew Zisserman VISART, 6 th September 2014 University of


slide-1
SLIDE 1

Re-­‑presen(ng ¡Art ¡Collec(ons ¡

University ¡of ¡Oxford ¡ VISART, ¡6th ¡September ¡2014 ¡

Joon ¡Son ¡Chung, ¡Relja ¡Arandjelović, ¡Giles ¡Bergel, ¡ ¡ Alex ¡Franklin ¡and ¡Andrew ¡Zisserman ¡

slide-2
SLIDE 2

Dataset: ¡The ¡Bodleian ¡Broadside ¡Ballads ¡

§ Photographs ¡of ¡around ¡900 ¡broadside ¡ballad ¡sheets ¡ § Broadside ¡ballad ¡sheets ¡are: ¡ ¡ § Cheap ¡printed ¡ballad ¡sheets ¡ § Printed ¡from ¡the ¡16th ¡to ¡the ¡20th ¡century ¡ § The ¡illustraSons ¡are ¡printed ¡with ¡woodblocks ¡

2 ¡

slide-3
SLIDE 3

Dataset: ¡The ¡Bodleian ¡Broadside ¡Ballads ¡

3 ¡

slide-4
SLIDE 4

Dataset: ¡The ¡Bodleian ¡Broadside ¡Ballads ¡

4 ¡

slide-5
SLIDE 5

Dataset: ¡The ¡Bodleian ¡Broadside ¡Ballads ¡

5 ¡

slide-6
SLIDE 6

Problem ¡statement ¡

l MoSvaSon: ¡ l Art ¡historians ¡now ¡have ¡huge ¡

digital ¡collecSons ¡for ¡study ¡

l Manual ¡analysis ¡inadequate ¡

for ¡collecSons ¡of ¡this ¡scale ¡

l Computer ¡vision ¡methods ¡can ¡generate ¡new ¡representaSons ¡

  • f ¡the ¡data ¡that ¡are ¡beXer ¡suited ¡to ¡their ¡research ¡problems ¡

6 ¡

slide-7
SLIDE 7

ObjecSves ¡

  • 1. ¡ ¡IdenSfying ¡woodcut ¡illustraSons ¡

7 ¡

slide-8
SLIDE 8

ObjecSves ¡

  • 2. ¡ ¡Clustering ¡by ¡semanSc ¡similarity ¡

8 ¡

slide-9
SLIDE 9

ObjecSves ¡

  • 3. ¡ ¡Clustering ¡by ¡exact ¡copies ¡(from ¡the ¡same ¡woodblock) ¡

9 ¡

slide-10
SLIDE 10

Outline ¡

  • 1. IdenSfying ¡woodcut ¡illustraSons ¡

a.

Finding ¡candidate ¡regions ¡

  • b. Matching ¡the ¡illustraSons ¡across ¡the ¡collecSon ¡to ¡

refine ¡the ¡regions ¡

  • 2. Clustering ¡by ¡semanSc ¡similarity ¡
  • 3. Clustering ¡by ¡exact ¡copies ¡
  • 4. ApplicaSon: ¡temporal ¡ordering ¡

10 ¡

slide-11
SLIDE 11

IdenSfying ¡woodcut ¡illustraSons ¡

§ First, ¡idenSfy ¡the ¡areas ¡of ¡text ¡ ¡

11 ¡

slide-12
SLIDE 12

IdenSfying ¡woodcut ¡illustraSons ¡

12 ¡

slide-13
SLIDE 13

IdenSfying ¡woodcut ¡illustraSons ¡

§ Areas ¡of ¡text ¡highlighted ¡

13 ¡

slide-14
SLIDE 14

IdenSfying ¡woodcut ¡illustraSons ¡

§ Remove ¡the ¡areas ¡of ¡text ¡from ¡the ¡image ¡ ¡

14 ¡

slide-15
SLIDE 15

IdenSfying ¡woodcut ¡illustraSons ¡

§ Remove ¡all ¡details ¡that ¡are ¡outside ¡the ¡page ¡boundary ¡

15 ¡

slide-16
SLIDE 16

IdenSfying ¡woodcut ¡illustraSons ¡

§ Find ¡the ¡bounding ¡boxes ¡of ¡the ¡remaining ¡objects ¡

16 ¡

slide-17
SLIDE 17

Outline ¡

  • 1. IdenSfying ¡woodcut ¡illustraSons ¡

a.

Finding ¡candidate ¡regions ¡

  • b. Matching ¡the ¡illustraSons ¡across ¡the ¡collecSon ¡to ¡

refine ¡the ¡regions ¡

  • 2. Clustering ¡by ¡semanSc ¡similarity ¡
  • 3. Clustering ¡by ¡exact ¡copies ¡
  • 4. ApplicaSon: ¡temporal ¡ordering ¡

17 ¡

slide-18
SLIDE 18

[Lowe04, ¡Philbin07] ¡

Hessian-­‑Affine ¡regions ¡+ ¡ RootSIFT ¡descriptors ¡ visual ¡words ¡

querying ¡

sparse ¡frequency ¡vector ¡ Inverted ¡ file ¡ ranked ¡image ¡ short-­‑list ¡ Set ¡of ¡RootSIFT ¡ descriptors ¡ query ¡input ¡

Geometric ¡ verifica(on ¡

[Lowe04, ¡Mikolajczyk07] ¡ [Sivic03] ¡

R-­‑idf ¡weigh(ng ¡

ImageMatch ¡

Philbin ¡et ¡al. ¡(2007), ¡Arandjelović ¡and ¡Zisserman ¡(2012) ¡

18 ¡

slide-19
SLIDE 19

ImageMatch ¡

query ¡input ¡

19 ¡

slide-20
SLIDE 20

Boundary ¡refinement ¡

§ Generate ¡ImageMatch ¡queries ¡from ¡all ¡candidate ¡illustraSons ¡ § Record ¡all ¡returns ¡

20 ¡

slide-21
SLIDE 21

Boundary ¡refinement ¡

2614 illustrations

21 ¡

§ Cluster ¡the ¡matches ¡from ¡other ¡candidates ¡that ¡overlap ¡the ¡

  • riginal ¡boundary ¡
slide-22
SLIDE 22

Outline ¡

  • 1. IdenSfying ¡woodcut ¡illustraSons ¡
  • 2. Clustering ¡by ¡semanSc ¡similarity ¡
  • 3. Clustering ¡by ¡exact ¡copies ¡
  • 4. ApplicaSon: ¡temporal ¡ordering ¡

22 ¡

slide-23
SLIDE 23

Clustering ¡by ¡semanSc ¡similarity ¡

§ Similarity ¡of ¡two ¡illustraSons ¡is ¡computed ¡as ¡a ¡weighted ¡

similariSes ¡of: ¡

§ The ¡GIST ¡descriptor ¡provides ¡a ¡holisSc ¡descripSon ¡of ¡the ¡scene

¡

§ The ¡VLAD ¡summarizes ¡the ¡distribuSon ¡of ¡local ¡SIFT ¡descriptors ¡

in ¡an ¡image ¡ ¡

§ SpaSally ¡pooled ¡VLAD ¡encodes ¡the ¡spaSal ¡informaSon ¡

! P0 P1 P2 P3 P4 P5

23 ¡

slide-24
SLIDE 24

Clustering ¡by ¡semanSc ¡similarity ¡

§ Similarity ¡of ¡two ¡illustraSons ¡is ¡computed ¡as ¡a ¡weighted ¡

similariSes ¡of ¡the ¡GIST, ¡the ¡VLAD ¡and ¡spaSally-­‑pooled ¡VLAD. ¡

§ The ¡pairwise ¡dissimilariSes ¡are ¡thresholded, ¡and ¡a ¡graph ¡is ¡formed

¡

§ Undirected ¡edges ¡represent ¡sufficient ¡similarity ¡

1.8 ¡ 2.2 ¡ 3.4 ¡ 3.5 ¡ 3.1 ¡ 2.9 ¡ Threshold ¡is ¡3.0 ¡

24 ¡

slide-25
SLIDE 25

Clustering ¡by ¡semanSc ¡similarity ¡

§ Similarity ¡of ¡two ¡illustraSons ¡is ¡computed ¡as ¡a ¡weighted ¡

similariSes ¡of ¡the ¡GIST, ¡the ¡VLAD ¡and ¡spaSally-­‑pooled ¡VLAD. ¡

§ The ¡pairwise ¡similariSes ¡are ¡thresholded, ¡and ¡a ¡graph ¡is ¡formed ¡ § Extract ¡connected ¡components ¡to ¡find ¡the ¡clusters ¡

1.8 ¡ 2.2 ¡ 3.4 ¡ 3.5 ¡ 3.1 ¡ 2.9 ¡

25 ¡

slide-26
SLIDE 26

Clustering ¡by ¡semanSc ¡similarity ¡

§ Similarity ¡of ¡two ¡illustraSons ¡is ¡computed ¡as ¡a ¡weighted ¡

similariSes ¡of ¡the ¡GIST, ¡the ¡VLAD ¡and ¡spaSally-­‑pooled ¡VLAD. ¡

§ The ¡pairwise ¡similariSes ¡are ¡thresholded, ¡and ¡a ¡graph ¡is ¡formed ¡ § Extract ¡connected ¡components ¡to ¡find ¡the ¡clusters ¡ § We ¡find ¡and ¡break ¡up ¡clusters ¡with ¡large ¡intra-­‑cluster ¡variability ¡

1.8 ¡ 2.2 ¡ 3.4 ¡ 3.5 ¡ 3.1 ¡ 2.9 ¡

26 ¡

slide-27
SLIDE 27

Clustering ¡by ¡semanSc ¡similarity ¡

740 clusters

27 ¡

slide-28
SLIDE 28

Outline ¡

  • 1. IdenSfying ¡woodcut ¡illustraSons ¡
  • 2. Clustering ¡by ¡semanSc ¡similarity ¡
  • 3. Clustering ¡by ¡exact ¡copies ¡
  • 4. ApplicaSon: ¡temporal ¡ordering ¡

28 ¡

slide-29
SLIDE 29

Clustering ¡by ¡exact ¡copies ¡

§ VLAD ¡descriptors ¡for ¡these ¡illustraSons ¡are ¡almost ¡the ¡same. ¡ § But, ¡are ¡these ¡from ¡the ¡same ¡woodblock? ¡

Frequency ¡of ¡visual ¡words ¡ Frequency ¡of ¡visual ¡words ¡

29 ¡

slide-30
SLIDE 30

Clustering ¡by ¡exact ¡copies ¡

§ A ¡linear ¡SVM ¡is ¡trained ¡to ¡disSnguish ¡between ¡a ¡pair ¡of ¡same

¡ and ¡similar ¡illustraSons. ¡Useful ¡features ¡are: ¡

§ The ¡number ¡of ¡putaSve ¡SIFT ¡matches, ¡ § The ¡raSo ¡of ¡spaSally ¡consistent ¡SIFT ¡matches, ¡ § The ¡density ¡of ¡matches, ¡ § The ¡spaSal ¡distribuSon ¡of ¡the ¡matches, ¡and ¡… ¡

30 ¡

slide-31
SLIDE 31

Clustering ¡by ¡exact ¡copies ¡

§ The ¡minimum ¡of ¡fine-­‑level ¡differences ¡in ¡image ¡details. ¡ ¡

Difference ¡images ¡

  • From ¡the ¡same ¡woodblock. ¡ ¡
  • The ¡differences ¡are ¡damages ¡to ¡the ¡
  • woodblock. ¡

¡ Difference ¡images ¡

  • From ¡different ¡woodblocks ¡
  • The ¡image ¡differences ¡are ¡due ¡to ¡spaSal ¡
  • inconsistencies. ¡

¡

31 ¡

Max ¡( ¡I1 ¡– ¡I2 ¡, ¡0 ¡) ¡ Max ¡( ¡I2 ¡– ¡I1 ¡, ¡0 ¡) ¡ Max ¡( ¡I1 ¡– ¡I2 ¡, ¡0 ¡) ¡ Max ¡( ¡I2 ¡– ¡I1 ¡, ¡0 ¡) ¡

slide-32
SLIDE 32

Clustering ¡by ¡exact ¡copies ¡

942 woodblocks

32 ¡

slide-33
SLIDE 33

Summary ¡staSsScs ¡

§ 918 ¡broadside ¡ballad ¡sheets ¡ § 2614 ¡illustraSons ¡ § 740 ¡semanScally ¡similar ¡clusters ¡ § 942 ¡different ¡woodblocks ¡used ¡to ¡print ¡the ¡illustraSons ¡

33 ¡

slide-34
SLIDE 34

Outline ¡

  • 1. IdenSfying ¡woodcut ¡illustraSons ¡
  • 2. Clustering ¡by ¡semanSc ¡similarity ¡
  • 3. Clustering ¡by ¡exact ¡copies ¡
  • 4. ApplicaSon: ¡temporal ¡ordering ¡

34 ¡

slide-35
SLIDE 35

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

§ Woodblocks ¡get ¡damaged ¡over ¡Sme. ¡ § We ¡use ¡the ¡visual ¡cues ¡apparent ¡on ¡the ¡illustraSons ¡to ¡find ¡

the ¡temporal ¡ordering ¡of ¡the ¡ballad ¡sheets. ¡

35 ¡

slide-36
SLIDE 36

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

Cues ¡of ¡woodblock ¡damage ¡

§ Woodblocks ¡get ¡damaged ¡over ¡Sme. ¡ § We ¡use ¡the ¡visual ¡cues ¡apparent ¡on ¡the ¡illustraSons ¡to ¡find ¡

the ¡temporal ¡ordering ¡of ¡the ¡ballad ¡sheets. ¡

36 ¡

slide-37
SLIDE 37

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

37 ¡

slide-38
SLIDE 38

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

38 ¡

1 3 4 2 5

slide-39
SLIDE 39

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

4 1 1 3 3 5 5 2

§ We ¡combine ¡the ¡cues ¡from ¡all ¡woodblocks ¡

39 ¡

slide-40
SLIDE 40

ApplicaSon: ¡temporal ¡ordering ¡of ¡the ¡prints ¡ ¡

40 ¡

1 3 4 2 5

slide-41
SLIDE 41

Conclusion ¡

§ The ¡three ¡contribuSons ¡of ¡this ¡presentaSon: ¡ § AutomaSc ¡cropping ¡of ¡illustraSons ¡ § SemanSc ¡clustering ¡ § Exact ¡clustering ¡ § The ¡illustraSons ¡are: ¡ § From ¡the ¡same ¡source, ¡ § Or ¡near ¡copies, ¡ ¡ § Or ¡different ¡depicSons. ¡ § Applicable ¡to ¡any ¡collecSon ¡with ¡some ¡commonality ¡in ¡

illustraSons ¡(e.g. ¡The ¡Book ¡of ¡Hours). ¡

41 ¡

slide-42
SLIDE 42

Catalogue ¡of ¡woodblocks ¡

¡ hXp://www.robots.ox.ac.uk/~vgg/demo/ballads/ ¡ ¡

42 ¡