PREserving Linked DAta: An introduc7on Carlo Meghini - - PowerPoint PPT Presentation

preserving linked data an introduc7on
SMART_READER_LITE
LIVE PREVIEW

PREserving Linked DAta: An introduc7on Carlo Meghini - - PowerPoint PPT Presentation

PREserving Linked DAta: An introduc7on Carlo Meghini ISTI CNR, Pisa Preserving Linked Data need Linked Digital Data Preserva7on need PRELIDA


slide-1
SLIDE 1

PREserving ¡Linked ¡DAta: ¡ An ¡introduc7on ¡

Carlo ¡Meghini ¡ ISTI ¡CNR, ¡Pisa ¡

slide-2
SLIDE 2

Preserving ¡Linked ¡Data ¡

Digital ¡ Preserva7on ¡ Linked ¡ Data ¡ need ¡ need ¡

slide-3
SLIDE 3

PRELIDA ¡

PREserving ¡LInked ¡DAta ¡

  • FP7 ¡Coordina7on ¡and ¡support ¡ac7on ¡
  • ICT-­‑2011.4.3 ¡Digital ¡Preserva7on ¡
  • Start ¡date: ¡January ¡1st, ¡2013 ¡
  • Dura7on: ¡24 ¡Months ¡
  • Funding: ¡770k ¡
slide-4
SLIDE 4

Beneficiaries ¡

  • Consiglio ¡Nazionale ¡delle ¡Ricerche ¡(Coord.) ¡
  • Alliance ¡for ¡Permanent ¡Access ¡
  • University ¡of ¡Huddersfields ¡
  • Universitaet ¡Innsbruck ¡
  • Europeana ¡
  • STI ¡
slide-5
SLIDE 5

Context ¡and ¡Mo7va7ons ¡

  • Data ¡economy ¡
  • Linked ¡Data ¡movement ¡

– need ¡to ¡preserve ¡Linked ¡Data ¡

  • Digital ¡preserva7on ¡

– needs ¡Linked ¡Data ¡ – faces ¡new ¡challenges ¡by ¡Linked ¡Data ¡

  • So ¡far, ¡liYle ¡or ¡no ¡interac7on ¡between ¡the ¡two ¡

communi7es ¡

slide-6
SLIDE 6

General ¡Objec7ves ¡

Bridge ¡the ¡LD ¡and ¡DP ¡communi7es ¡for ¡

  • making ¡the ¡LD ¡community ¡aware ¡of ¡the ¡

exis7ng ¡DP ¡results ¡

  • making ¡the ¡DP ¡community ¡aware ¡of ¡the ¡

challenges ¡posed ¡by ¡LD ¡

– intrinsic ¡features ¡of ¡Linked ¡Data, ¡including ¡their ¡ structuring, ¡interlinking, ¡dynamicity ¡and ¡

  • distribu7on. ¡
slide-7
SLIDE 7

Specific ¡Objec7ves ¡

  • collect, ¡organize ¡and ¡publish ¡use ¡cases ¡related ¡

to ¡the ¡long-­‑term ¡access ¡to ¡LD ¡

  • create ¡a ¡comprehensive ¡state ¡of ¡the ¡art ¡on ¡LD ¡

and ¡DP ¡technologies ¡

  • set ¡up ¡a ¡technology ¡observatory ¡
  • bring ¡together ¡scien7sts ¡and ¡stakeholders ¡for ¡

iden7fying ¡relevant ¡challenges ¡and ¡paths ¡for ¡ addressing ¡them ¡in ¡the ¡near ¡future ¡

slide-8
SLIDE 8

Specific ¡Objec7ves ¡

  • perform ¡a ¡gap ¡analysis ¡between ¡needs ¡and ¡

tools ¡

  • create ¡a ¡roadmap ¡making ¡the ¡research ¡agenda ¡

in ¡preserving ¡linked ¡data ¡

  • draw ¡aYen7on ¡of ¡standardiza7on ¡bodies ¡
slide-9
SLIDE 9

The ¡Working ¡Group ¡

Dis7nguished ¡people ¡from ¡the ¡Linked ¡Data ¡and ¡ the ¡Digital ¡Preserva7on ¡communi7es ¡

– stakeholders ¡ – academia ¡ – companies ¡ – std ¡bodies ¡

to ¡help ¡PRELIDA ¡achieve ¡its ¡goals ¡

slide-10
SLIDE 10

Tools ¡

  • Workshops ¡

– 3 ¡of ¡them ¡

  • On-­‑line ¡pla^orm ¡

– Communica7on ¡& ¡Collabora7on ¡

  • Dissemina7on ¡ac7vi7es ¡

– portal ¡ – workshop ¡reports ¡or ¡proceedings ¡ – links ¡with ¡relevant ¡projects ¡& ¡organiza7ons ¡ – summer ¡schools ¡

slide-11
SLIDE 11

Workshops ¡

  • Opening ¡workshop ¡(June ¡25-­‑27, ¡2013) ¡

– presenta7ons ¡ – discussions ¡ – final ¡report ¡

  • Midterm ¡workshop ¡(April ¡2-­‑4, ¡2014) ¡

– Help ¡defining ¡the ¡scien7fic ¡structure ¡ ¡

  • Consolida7on ¡& ¡dissemina7on ¡workshop ¡(end ¡

2014) ¡

– Open ¡

slide-12
SLIDE 12

The ¡global ¡picture ¡

Now ¡

slide-13
SLIDE 13

Challenges, ¡so ¡far ¡

  • LD ¡are ¡a ¡form ¡of ¡formal ¡knowledge ¡

– formal ¡knowledge ¡is ¡used ¡for ¡preserving ¡objects ¡ (viz. ¡OAIS ¡informa7on ¡model), ¡but ¡how ¡do ¡we ¡ preserve ¡it? ¡

  • the ¡world ¡changes ¡
  • our ¡knowledge ¡of ¡the ¡world ¡changes ¡
  • the ¡language ¡that ¡we ¡use ¡to ¡express ¡our ¡knowledge ¡of ¡

the ¡world ¡changes ¡

– how ¡do ¡we ¡communicate ¡a ¡message ¡via ¡a ¡ changing ¡language? ¡

slide-14
SLIDE 14

Challenges, ¡so ¡far ¡

  • LD ¡depend ¡on ¡the ¡web ¡infrastructure ¡for ¡de-­‑

referencing ¡HTTP ¡URIs ¡

– how ¡do ¡we ¡make ¡sure ¡the ¡web ¡will ¡keep ¡going ¡

  • LD ¡are ¡distributed ¡in ¡nature ¡ ¡

– how ¡do ¡we ¡manage ¡the ¡preserva7on ¡of ¡the ¡ interdependencies ¡amongst ¡datasets ¡

slide-15
SLIDE 15

Challenges, ¡so ¡far ¡

  • LD ¡are ¡accessible ¡in ¡many ¡ways: ¡ ¡

– SPARQL ¡end-­‑points ¡ – RDF ¡dumps ¡ – RDF ¡dumps ¡plus ¡incremental ¡updates ¡ – RDFa ¡ – microdata ¡etc. ¡ Which ¡formats ¡is ¡best ¡to ¡preserve? ¡ ¡

slide-16
SLIDE 16

Challenges, ¡so ¡far ¡

  • Preserva7on ¡requires ¡the ¡expression ¡and ¡

recording ¡of ¡several ¡kinds ¡of ¡metadata ¡about ¡ the ¡preserved ¡objects. ¡For ¡preserving ¡LD ¡such ¡ metadata ¡should ¡be ¡associated ¡with ¡RDF ¡ triples, ¡and ¡at ¡the ¡moment ¡there ¡is ¡no ¡obvious ¡ way ¡(apart ¡from ¡reifica7on) ¡to ¡express ¡ metadata ¡about ¡RDF ¡triples. ¡

– quadruples ¡ – nested ¡triples ¡

slide-17
SLIDE 17

Conclusions ¡

  • Many ¡interes7ng ¡problems ¡
  • No ¡simple, ¡ready ¡solu7on ¡
  • Need ¡major ¡research ¡efforts ¡