Family History Technology: A Survey of 10 Hard Problems - - PowerPoint PPT Presentation

family history technology a survey of 10 hard problems
SMART_READER_LITE
LIVE PREVIEW

Family History Technology: A Survey of 10 Hard Problems - - PowerPoint PPT Presentation

Family History Technology: A Survey of 10 Hard Problems Dr. Doran Wilde Brigham Young University Dept. Electrical and Computer Engineering Family


slide-1
SLIDE 1

Family ¡History ¡Technology: ¡ A ¡Survey ¡of ¡10 ¡Hard ¡Problems ¡

  • Dr. ¡Doran ¡Wilde ¡

Brigham ¡Young ¡University ¡

  • Dept. ¡Electrical ¡and ¡Computer ¡Engineering ¡

¡ Family ¡History ¡Technology ¡Workshop ¡2014 ¡

slide-2
SLIDE 2

Decomposing ¡a ¡ Really ¡Really ¡Hard ¡Problem ¡ ¡

  • The ¡goal ¡is ¡to ¡build ¡a ¡common ¡lineage-­‑linked ¡

family ¡tree ¡for ¡the ¡whole ¡human ¡race ¡based ¡ upon ¡available ¡records. ¡

  • Decompose ¡this ¡seemingly ¡impossible ¡

challenge ¡into ¡10 ¡hard ¡problems. ¡

  • Allows ¡researchers ¡to ¡focus ¡on ¡a ¡part ¡of ¡the ¡
  • verall ¡problem. ¡
  • Illustrated ¡by ¡a ¡running ¡example. ¡
slide-3
SLIDE 3

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

1 2 3 4 5 6 7 8 9 10 Family ¡History ¡Technology ¡

10 ¡Hard ¡Problems ¡

slide-4
SLIDE 4

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-5
SLIDE 5

Document ¡DigiOzaOon ¡and ¡ PreservaOon ¡

PreservaOon, ¡ Accessibility, ¡and ¡ Enhancement ¡of ¡ Records ¡

slide-6
SLIDE 6

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-7
SLIDE 7

Document ¡Processing ¡

SpaOally ¡parse ¡ the ¡page ¡into ¡ blocks ¡to ¡give ¡ context ¡and ¡ meaning ¡to ¡ what ¡is ¡

  • wriYen. ¡

¡

  • Zoning. ¡
slide-8
SLIDE 8

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-9
SLIDE 9

Document ¡Processing ¡and ¡ HandwriOng ¡RecogniOon ¡

Lines ¡ passed ¡from ¡ image ¡to ¡ handwriOng ¡ recognizer, ¡ and ¡collates ¡ the ¡results ¡ back ¡into ¡an ¡ annotated ¡ transcript ¡of ¡ the ¡record. ¡ ¡ ¡

slide-10
SLIDE 10

Document ¡Processing ¡and ¡ HandwriOng ¡RecogniOon ¡

[Annotated ¡transcript] ¡ [Christening ¡Record] ¡ [Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ [Image ¡112] ¡ [Heading] ¡1810 ¡ [Margin ¡Note] ¡2den ¡Sondag ¡p. ¡3 ¡Konger. ¡ [Body] ¡ [Line ¡1] ¡Thyge ¡Pedersens ¡Son ¡dobt ¡Anders. ¡Faddern ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusens ¡hustru, ¡Præ ¡ [Line ¡4] ¡stens ¡hustrue ¡bar ¡det.— ¡ [ ¡AnnotaOons ¡are ¡added ¡

  • r ¡inferred ¡by ¡the ¡

document ¡processor ¡ with ¡human ¡input.] ¡ A ¡transcript ¡is ¡a ¡faithful ¡ copy ¡that ¡preserves ¡the ¡ characterisOcs ¡of ¡the ¡

  • riginal ¡as ¡much ¡as ¡

possible, ¡making ¡a ¡ useful ¡copy ¡for ¡further ¡ analysis ¡and ¡research. ¡

slide-11
SLIDE 11

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-12
SLIDE 12

Document ¡Markup ¡

[Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ [Image ¡112] ¡ [Heading] ¡1810 ¡ [Margin ¡Note] ¡2den ¡Sondag ¡p. ¡3 ¡Konger. ¡ ¡ [Body] ¡ [Line ¡1] ¡Thyge ¡Pedersens ¡Son ¡dobt ¡Anders. ¡Faddern ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusens ¡hustru, ¡Præ ¡ [Line ¡4] ¡stens ¡hustrue ¡bar ¡det.— ¡ [Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ [Image ¡112] ¡ [Heading] ¡1810 ¡ [Margin ¡Note] ¡2nd ¡Sunday ¡past ¡3 ¡Kings. ¡ [Body] ¡ [Line ¡1] ¡Thyges ¡Pedersen’s ¡Son ¡christened ¡Anders. ¡ ¡Witnesses ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusen’s ¡wife, ¡the ¡Priest’s ¡ ¡ [Line ¡4] ¡wife ¡carried ¡the ¡child. ¡— ¡ ¡

(English ¡ TranslaOon) ¡ (Danish) ¡ Uses ¡Date ¡Authority ¡ Uses ¡Name ¡Authority ¡ Uses ¡Place ¡Authority ¡ Categorize ¡text ¡into ¡semanOc ¡ elements: ¡names, ¡dates, ¡places, ¡etc. ¡ Adds ¡markup ¡to ¡the ¡document ¡to ¡ convey ¡this ¡informaOon. ¡ ¡

slide-13
SLIDE 13

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-14
SLIDE 14

Facts ¡

  • Also ¡called ¡asserOons ¡

(facts ¡with ¡associated ¡ confidence ¡raOngs). ¡

  • Answer ¡the ¡quesOons: ¡

– what ¡ ¡(fact ¡type) ¡ – who/role ¡(might ¡be ¡ mulOple ¡persons) ¡ – when ¡ ¡(date) ¡ – where ¡ ¡(place) ¡

slide-15
SLIDE 15

Data ¡ExtracOon ¡

Inferred ¡Facts: ¡

  • Source ¡CitaOon: ¡Oro, ¡Fredericksborg, ¡Denmark ¡Church ¡Records, ¡

Christenings, ¡Image ¡112 ¡[Document ¡Processor] ¡

  • LocaOon ¡is ¡Oro, ¡Fredericksborg, ¡Denmark ¡[Place ¡Authority] ¡
  • 3 ¡Kings ¡Day ¡is ¡January ¡6. ¡[Date ¡Authority] ¡
  • 2nd ¡Sunday ¡past ¡3 ¡Kings ¡Day ¡in ¡1810 ¡is ¡January ¡14, ¡1810. ¡[Date ¡Authority] ¡
  • Anders ¡Thygesen ¡was ¡christened ¡
  • Thyges ¡Pedersen ¡was ¡the ¡father ¡of ¡Anders ¡Thygesen ¡
  • Henning ¡Pedersen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡
  • Soren ¡Michelsen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡
  • Hans ¡Andersen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡
  • Else ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡
  • Else ¡was ¡the ¡wife ¡of ¡Ole ¡Rasmusen ¡
  • The ¡Priest’s ¡wife ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡

(12 ¡Facts ¡from ¡this ¡simple ¡Christening ¡record.) ¡

slide-16
SLIDE 16

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-17
SLIDE 17

Family ¡Linked ¡Data ¡Model ¡

Anders ¡ Thygesen ¡ Thyge ¡ Pedersen ¡ Henning ¡ Pedersen ¡ Soren ¡ Michelsen ¡ Hans ¡ Andersen ¡ [Wife] ¡ Else ¡ Ole ¡ Rasmussen ¡ Priest ¡ Father ¡ Wife ¡ Wife ¡ Witness ¡ Witness ¡ Witness ¡ Witness ¡ Witness ¡ Christening ¡Event ¡ January ¡14, ¡1810 ¡ Oro, ¡Frederiksborg, ¡Denmark ¡

slide-18
SLIDE 18

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-19
SLIDE 19

Record ¡Linkage/Merging ¡

Record ¡linking ¡determines ¡when ¡two ¡or ¡more ¡ different ¡records ¡refer ¡to ¡the ¡same ¡individual. ¡ ¡ Duplicates ¡are ¡merged ¡together ¡ to ¡build ¡lineage-­‑linked ¡families. ¡

slide-20
SLIDE 20

Document ¡ Processing ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ RecogniOon ¡(OCR) ¡ PopulaOon ¡ ReconsOtuOon ¡ Record ¡Linking ¡ Merging ¡ Family ¡Linked ¡ Data ¡Model ¡ Document ¡ DigiOzaOon ¡ Digital ¡Experts ¡ Digital ¡Assistants ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ ¡ Human ¡Computer ¡ Interface ¡ Document ¡ Markup ¡ Data ¡ExtracOon ¡

slide-21
SLIDE 21

Search, ¡VisualizaOon ¡& ¡ Computer-­‑Human ¡Interface ¡ ¡

New ¡ interacOve ¡

  • charts. ¡

Mobile ¡apps ¡ BeYer ¡tools ¡

slide-22
SLIDE 22

Summary ¡

  • I ¡have ¡surveyed ¡10 ¡problems ¡that ¡are ¡on ¡the ¡

criOcal ¡path ¡to ¡a ¡revoluOonary ¡break-­‑through ¡in ¡ the ¡way ¡we ¡do ¡genealogical ¡research. ¡

  • There ¡are ¡undoubtedly ¡other ¡important ¡problems ¡

that ¡impede ¡family ¡history ¡that ¡haven’t ¡been ¡ menOoned ¡or ¡haven’t ¡yet ¡been ¡idenOfied. ¡

  • The ¡Family ¡History ¡Technology ¡Workshop ¡is ¡held ¡

to ¡discuss ¡these ¡kinds ¡of ¡problems. ¡

  • The ¡hope ¡is ¡that ¡technology ¡can ¡put ¡the ¡ulOmate ¡

goal ¡of ¡assembling ¡a ¡family ¡tree ¡for ¡all ¡people ¡ within ¡reach. ¡ ¡