family history technology a survey of 10 hard problems
play

Family History Technology: A Survey of 10 Hard Problems - PowerPoint PPT Presentation

Family History Technology: A Survey of 10 Hard Problems Dr. Doran Wilde Brigham Young University Dept. Electrical and Computer Engineering Family


  1. Family ¡History ¡Technology: ¡ A ¡Survey ¡of ¡10 ¡Hard ¡Problems ¡ Dr. ¡Doran ¡Wilde ¡ Brigham ¡Young ¡University ¡ Dept. ¡Electrical ¡and ¡Computer ¡Engineering ¡ ¡ Family ¡History ¡Technology ¡Workshop ¡2014 ¡

  2. Decomposing ¡a ¡ Really ¡Really ¡Hard ¡Problem ¡ ¡ • The ¡goal ¡is ¡to ¡build ¡a ¡common ¡lineage-­‑linked ¡ family ¡tree ¡for ¡the ¡whole ¡human ¡race ¡based ¡ upon ¡available ¡records. ¡ • Decompose ¡this ¡seemingly ¡impossible ¡ challenge ¡into ¡10 ¡hard ¡problems. ¡ • Allows ¡researchers ¡to ¡focus ¡on ¡a ¡part ¡of ¡the ¡ overall ¡problem. ¡ • Illustrated ¡by ¡a ¡running ¡example. ¡

  3. 1 Document ¡ Family ¡History ¡Technology ¡ DigiOzaOon ¡ 3 10 ¡Hard ¡Problems ¡ HandwriOng ¡ RecogniOon ¡& ¡ 2 OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ 4 8 10 Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ 5 VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ 6 Family ¡Linked ¡ Data ¡Model ¡ 9 7 Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  4. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  5. Document ¡DigiOzaOon ¡and ¡ PreservaOon ¡ PreservaOon, ¡ Accessibility, ¡and ¡ Enhancement ¡of ¡ Records ¡

  6. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  7. Document ¡Processing ¡ SpaOally ¡parse ¡ the ¡page ¡into ¡ blocks ¡to ¡give ¡ context ¡and ¡ meaning ¡to ¡ what ¡is ¡ wriYen. ¡ ¡ Zoning. ¡

  8. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  9. Document ¡Processing ¡and ¡ HandwriOng ¡RecogniOon ¡ Lines ¡ passed ¡from ¡ image ¡to ¡ handwriOng ¡ recognizer, ¡ and ¡collates ¡ the ¡results ¡ back ¡into ¡an ¡ annotated ¡ transcript ¡of ¡ the ¡record. ¡ ¡ ¡

  10. Document ¡Processing ¡and ¡ HandwriOng ¡RecogniOon ¡ [ ¡AnnotaOons ¡are ¡added ¡ [Annotated ¡transcript] ¡ or ¡inferred ¡by ¡the ¡ [Christening ¡Record] ¡ document ¡processor ¡ [Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ with ¡human ¡input.] ¡ [Image ¡112] ¡ [Heading] ¡1810 ¡ A ¡ transcript ¡is ¡a ¡ faithful ¡ [Margin ¡Note] ¡2 den ¡Sondag ¡p. ¡3 ¡Konger. ¡ copy ¡that ¡preserves ¡the ¡ [Body] ¡ characterisOcs ¡of ¡the ¡ [Line ¡1] ¡Thyge ¡Pedersens ¡Son ¡dobt ¡Anders. ¡Faddern ¡ original ¡as ¡much ¡as ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ possible, ¡making ¡a ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusens ¡hustru, ¡Præ ¡ useful ¡copy ¡for ¡further ¡ [Line ¡4] ¡stens ¡hustrue ¡bar ¡det.— ¡ analysis ¡and ¡research. ¡

  11. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  12. Document ¡Markup ¡ [Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ (Danish) ¡ [Image ¡112] ¡ Categorize ¡text ¡into ¡semanOc ¡ [Heading] ¡1810 ¡ elements: ¡names, ¡dates, ¡places, ¡etc. ¡ [Margin ¡Note] ¡2 den ¡Sondag ¡p. ¡3 ¡Konger. ¡ ¡ Adds ¡markup ¡to ¡the ¡document ¡to ¡ [Body] ¡ convey ¡this ¡informaOon. ¡ ¡ [Line ¡1] ¡Thyge ¡Pedersens ¡Son ¡dobt ¡Anders. ¡Faddern ¡ Uses ¡Date ¡Authority ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ Uses ¡Name ¡Authority ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusens ¡hustru, ¡Præ ¡ Uses ¡Place ¡Authority ¡ [Line ¡4] ¡stens ¡hustrue ¡bar ¡det.— ¡ [Source: ¡Church ¡records, ¡Oro, ¡Frederiksborg, ¡Denmark] ¡ (English ¡ [Image ¡112] ¡ TranslaOon) ¡ [Heading] ¡1810 ¡ [Margin ¡Note] ¡2 nd ¡Sunday ¡past ¡3 ¡Kings. ¡ [Body] ¡ [Line ¡1] ¡Thyges ¡Pedersen’s ¡Son ¡christened ¡Anders. ¡ ¡Witnesses ¡ [Line ¡2] ¡Henning ¡Pedersen, ¡Soren ¡Michelsen, ¡Hans ¡ ¡ [Line ¡3] ¡Andersen, ¡Else ¡Ole ¡Rasmusen’s ¡wife, ¡the ¡Priest’s ¡ ¡ [Line ¡4] ¡wife ¡carried ¡the ¡child. ¡— ¡ ¡

  13. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  14. Facts ¡ • Also ¡called ¡asserOons ¡ (facts ¡with ¡associated ¡ confidence ¡raOngs). ¡ • Answer ¡the ¡quesOons: ¡ – what ¡ ¡(fact ¡type) ¡ – who/role ¡(might ¡be ¡ mulOple ¡persons) ¡ – when ¡ ¡(date) ¡ – where ¡ ¡(place) ¡

  15. Data ¡ExtracOon ¡ Inferred ¡Facts: ¡ Source ¡CitaOon: ¡Oro, ¡Fredericksborg, ¡Denmark ¡Church ¡Records, ¡ • Christenings, ¡Image ¡112 ¡[Document ¡Processor] ¡ LocaOon ¡is ¡Oro, ¡Fredericksborg, ¡Denmark ¡[Place ¡Authority] ¡ • 3 ¡Kings ¡Day ¡is ¡January ¡6. ¡[Date ¡Authority] ¡ • 2 nd ¡Sunday ¡past ¡3 ¡Kings ¡Day ¡in ¡1810 ¡is ¡January ¡14, ¡1810. ¡[Date ¡Authority] ¡ • Anders ¡Thygesen ¡was ¡christened ¡ • Thyges ¡Pedersen ¡was ¡the ¡father ¡of ¡Anders ¡Thygesen ¡ • Henning ¡Pedersen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡ • Soren ¡Michelsen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡ • Hans ¡Andersen ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡ • Else ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡ • Else ¡was ¡the ¡wife ¡of ¡Ole ¡Rasmusen ¡ • The ¡Priest’s ¡wife ¡was ¡a ¡witness ¡to ¡the ¡christening ¡of ¡Anders ¡Thygesen ¡ • (12 ¡Facts ¡from ¡this ¡simple ¡Christening ¡record.) ¡

  16. Document ¡ DigiOzaOon ¡ HandwriOng ¡ RecogniOon ¡& ¡ OpOcal ¡Character ¡ Document ¡ RecogniOon ¡(OCR) ¡ Processing ¡ Document ¡ Markup ¡ Intelligent ¡Search ¡ ¡ VisualizaOon ¡ Data ¡ExtracOon ¡ ¡ Digital ¡Experts ¡ Human ¡Computer ¡ Digital ¡Assistants ¡ Interface ¡ Family ¡Linked ¡ Data ¡Model ¡ Record ¡Linking ¡ PopulaOon ¡ Merging ¡ ReconsOtuOon ¡

  17. Family ¡Linked ¡Data ¡Model ¡ Christening ¡Event ¡ January ¡14, ¡1810 ¡ Father ¡ Anders ¡ Thyge ¡ Oro, ¡Frederiksborg, ¡Denmark ¡ Thygesen ¡ Pedersen ¡ Witness ¡ Witness ¡ Witness ¡ Witness ¡ Witness ¡ Henning ¡ Soren ¡ Hans ¡ Else ¡ [Wife] ¡ Pedersen ¡ Michelsen ¡ Andersen ¡ Wife ¡ Wife ¡ Ole ¡ Priest ¡ Rasmussen ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend