E f f i c i e n t A l g o r i t h m s a n d U s e r I n t e r a c t i o n f o r M e t a d a t a E x t r a c t i o n f r o m H i s t o r i c a l M a p s Benedikt Budig, Universität Würzburg
O v e r v i e w ● H i s t o r i c a l M a p s : w h a t a n d w h y ? ● S k e t c h o f a P i p e l i n e – f r o m b i t m a p i m a g e t o g e o r e f e r e n c e d m e t a d a t a ● M o d u l e 1 : L o c a t e M a p E l e m e n t s ● M o d u l e 2 : M a t c h L a b e l s a n d P l a c e M a r k e r s ● O p e n Q u e s t i o n s & F u t u r e W o r k
S t u d y h i s t o r i c a l m a p s : w h y ? ● M a n y l i b r a r i e s h a v e l a r g e c o l l e c t i o n s o f h i s t o r i c a l m a p s ● R e l e v a n t f o r t h e ( d i g i t a l ) h u m a n i t i e s – H i s t o r y o f c a r t o g r a p h y – G e n e r a l h i s t o r y – S p e c i f i c e x a m p l e : o n o m a s t i c s
Wh a t h a p p e n s w i t h h i s t o r i c a l m a p s ? ● S t o r e d i n a l i b r a r y b a s e m e n t – R e t r i e v a b l e b y b i b l i o g r a p h i c i n f o r m a t i o n ● H i g h - q u a l i t y b i t m a p s c a n s , o n l i n e c a t a l o g u e – B r o w s a b l e b y b i b l i o g r a p h i c i n f o r m a t i o n ● U s e f u l q u e r i e s ? – I n a c t u a l r e s e a r c h p r a c t i c e – B y i n t e r e s t e d l a y p e o p l e
M e t a d a t a : w h a t ? ● C o n t a i n e d s e t t l e m e n t s ● L a n d s c a p e t o p o g r a p h y ● G e o p o l i t i c a l f e a t u r e s ● … ● I d e a l l y : g e o r e f e r e n c e d
M e t a d a t a : h o w ? ● D o i t b y h a n d ● S o f t w a r e : u s a b i l i t y i m p r o v e m e n t s – G a i n s i n e f f i c i e n c y a r e l i m i t e d ● S o f t w a r e : c o m p u t e r v i s i o n – N o p a n a c e a , b u t c a n w o r k w e l l f o r r e s t r i c t e d c o r p o r a – S i g n i f i c a n t c u s t o m R & D e f f o r t e v e r y t i m e
F o r e x a m p l e . . . ● F o r e s t - c o v e r a n a l y s i s o f t h e “ S i e g f r i e d M a p ” [ L e y k , B o e s c h , W e i b e l ] ● 6 0 0 0 s h e e t s , p r o d u c e d 1 8 7 0 t o 1 9 2 2
O u r s c o p e ● W e c o n s i d e r m a p s f r o m e a r l y m o d e r n p e r i o d f o r w a r d ● U n i q u e g r a p h i c a l s t y l e s ● D i f f e r e n t f o n t s , h a n d w r i t i n g ● D i f f e r e n t c a r t o g r a p h i c c o n v e n t i o n s
S o w h a t n o w ? ● S p l i t p r o b l e m i n t o s m a l l e r g o a l s ● D e s i g n a m o d u l a r p i p e l i n e S e g m e n t a t i o n C l u s t e r i n g a n d O p t i c a l C h a r a c t e r G e o r e f e r e n c i n g M a t c h i n g R e c o g n i t i o n
S e g m e n t a t i o n C l u s t e r i n g a n M a t c h i n
S e g m e n t a t i o n ● S m a l l e r g o a l s ● L o o k f o r o n e p a r t i c u l a r e l e m e n t o n o n e m a p [ B u d i g a n d v a n D i j k 2 0 1 5 ]
[ D e m o ]
I n g r e d i e n t 1 : T e m p l a t e M a t c h i n g
T e m p l a t e m a t c h i n g ● F i n d a p p r o x i m a t e r e p e a t - o c c u r r e n c e s o f a n e x a m p l e i m a g e ● H e r e : – 1 - B i t b l a c k - a n d - w h i t e – O n l y c o n s i d e r s t r a n s l a t i o n – P e r c e n t a g e - c o r r e c t s c o r e
M a t c h i n g s c o r e
I n g r e d i e n t 2 : A c t i v e L e a r n i n g
D a t a s e t s
R O C
L e a r n i n g c u r v e s
S e g m e n t a t i o n C l u s t e r i n g a n d O p t i c a l C h a r M a t c h i n g R e c o g n i t i o n
M a t c h i n g L a b e l s a n d P l a c e M a r k e r s ● A s s u m p t i o n : l a b e l s a n d m a r k e r s a l r e a d y d e t e c t e d ● M a t c h t h e c o r r e s p o n d i n g o n e s [ B u d i g , v a n D i j k , W o l f f , 2 0 1 4 ]
W a n t e d : a M a t c h i n g ● F i n d a m a t c h i n g o f l a b e l s a n d p l a c e m a r k e r s ● N o 1 - t o - 1 a s s i g n m e n t p o s s i b l e ● B a s i c a s s u m p t i o n : l a b e l s a r e n e a r t h e i r c o r r e s p o n d i n g m a r k e r s ● G r e e d y s t r a t e g y ? → d o e s n o t w o r k w e l l !
E x p e r i m e n t a l R e s u l t s ● F r a n c k e n l a n d t ( 1 5 3 3 ) – 5 3 9 m a r k e r s , 5 2 4 l a b e l s – o u r a l g o r i t h m : e r r o r r a t e 3 . 5 % – g r e e d y a l g o r i t h m : e r r o r r a t e 1 7 . 8 % ● C i r c u l u s F r a n c o n i c u s ( 1 7 0 6 ) – 1 6 6 3 m a r k e r s , 1 6 6 9 l a b e l s – o u r a l g o r i t h m : e r r o r r a t e 1 . 3 % – g r e e d y a l g o r i t h m : e r r o r r a t e 5 . 9 %
Wh a t n o w ? ● E r r o r r a t e s i n e x p e r i m e n t s : 1 . 3 % a n d 3 . 5 % ● U n c l e a r s i t u a t i o n s : ● M a n u a l v e r i f i c a t i o n o r c o r r e c t i o n n e c e s s a r y
S e n s i t i v i t y ● O n l y s h o w a s s i g n m e n t s o u r a l g o r i t h m s i s u n c e r t a i n a b o u t ● C a l c u l a t e s e n s i t i v i t y a n a l y s i s f o r t h e m a t c h i n g → F o r e a c h a s s i g n m e n t , c a l c u l a t e t h e b e s t m a t c h i n g t h a t d o e s n o t u s e i t a n d s e e h o w m u c h w o r s e i t i s .
C o n c l u s i o n ● H i s t o r i c a l m a p s a r e c o o l , b u t h a r d t o s e a r c h ● M o d u l a r p i p e l i n e i s r e a s o n a b l e → ● H u m a n e f f o r t i s n e c e s s a r y s m a r t i n t e r a c t i o n s ! ● T e m p l a t e m a t c h i n g & a c t i v e l e a r n i n g w o r k w e l l ● S e n s i t i v i t y a n a l y s i s f o r e f f i c i e n t i n t e r a c t i o n s
O p e n Q u e s t i o n s & F u t u r e W o r k ● S o l v e m o r e s m a l l g o a l s f r o m t h e p i p e l i n e , t h e n i n t e g r a t e – C l u s t e r t e m p l a t e m a t c h e s ( e . g . i n t o l a b e l s ) – U s e a l r e a d y c o l l e c t e d i n f o r m a t i o n f o r O C R – G e o r e f e r e n c i n g , . . . ● S h o u l d t h e p i p e l i n e r e a l l y b e s e q u e n t i a l ? ● C r o w d s o u r c i n g ? S e g m e n t a t i o n C l u s t e r i n g a n d O p t i c a l C h a r a c t e r G e o r e f e r e n c i n g M a t c h i n g R e c o g n i t i o n
S m a r t p h o n e
Recommend
More recommend