Naive reasoning on RDF streams Emanuele Della Valle - - PowerPoint PPT Presentation

naive reasoning on rdf streams
SMART_READER_LITE
LIVE PREVIEW

Naive reasoning on RDF streams Emanuele Della Valle - - PowerPoint PPT Presentation

Stream Reasoning For Linked Data M. Balduini, J-P Calbimonte, O. Corcho, D. Dell'Aglio, E. Della Valle, and J.Z. Pan http://streamreasoning.org/sr4ld2013 Naive reasoning on RDF streams Emanuele Della Valle emanuele.dellavalle@polimi.it


slide-1
SLIDE 1

Stream Reasoning For Linked Data

  • M. Balduini, J-P Calbimonte, O. Corcho,
  • D. Dell'Aglio, E. Della Valle, and J.Z. Pan

http://streamreasoning.org/sr4ld2013

Naive reasoning on RDF streams

Emanuele Della Valle emanuele.dellavalle@polimi.it http://emanueledellavalle.org

slide-2
SLIDE 2

http://streamreasoning.org/sr4ld2013

Share, Remix, Reuse — Legally

§ This work is licensed under the Creative Commons Attribution 3.0 Unported License. § Your are free:

  • to Share — to copy, distribute and transmit the work
  • to Remix — to adapt the work

§ Under the following conditions

  • Attribution — You must attribute the work by inserting

– “[source http://streamreasoning.org/sr4ld2013]” at the end of each reused slide – a credits slide stating

  • These slides are partially based on “Streaming Reasoning for Linked

Data 2013” by M. Balduini, J-P Calbimonte, O. Corcho, D. Dell'Aglio,

  • E. Della Valle, and J.Z. Pan http://streamreasoning.org/sr4ld2013

§ To view a copy of this license, visit http://creativecommons.org/licenses/by/3.0/

2

slide-3
SLIDE 3

http://streamreasoning.org/sr4ld2013

Agenda

§ Forms of reasoning for Q/A § Naïve forms of stream reasoning for Q/A § A not so naïve form of stream reasoning for Q/A § Wrap up

3

slide-4
SLIDE 4

http://streamreasoning.org/sr4ld2013

MEMO: forms of reasoning for Q/A

§ Data-driven (a.k.a. forward reasoning) § Query-driven – backward reasoning § Query-driven – query rewriting (a.k.a. ontology based data access)

4 Reasoner RDF data SPARQL Inferred data

  • ntology

SPARQL

  • ntology

Rewritten query Reasoner Reasoner RDF data SPARQL

  • ntology

data

slide-5
SLIDE 5

http://streamreasoning.org/sr4ld2013

Naïve Stream Reasoning

§ Data-driven (a.k.a. forward reasoning) § Query-driven – backward reasoning § Query-driven – query rewriting (a.k.a. ontology based data access)

5 Reasoner RDF data SPARQL Inferred data

  • ntology
  • ntology

Rewritten query Reasoner Reasoner RDF data

  • ntology

S2R S2R S2R SPARQL SPARQL data

slide-6
SLIDE 6

http://streamreasoning.org/sr4ld2013

Example of Stream Reasoning 1/2

§ Query: measure the the impact of Alice's microposts MEMO: our running example data model § For example

6

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

Post discusses Alice posts p1 . Bob posts p2 .

slide-7
SLIDE 7

http://streamreasoning.org/sr4ld2013

discusses ¡ discusses ¡ discusses ¡ discusses ¡ discusses ¡ discusses ¡ discusses ¡

Example of Stream Reasoning 2/2

What impact has been my micropost p1 creating in the last hour? Let’s count the number of microposts that discuss it … REGISTER STREAM ImpactMeter AS SELECT (count(?p) AS ?impact) FROM STREAM <http://…/fb> [RANGE 60m STEP 10m] WHERE { :Alice posts [ sr:discusses ?p ] } p1 ¡ p3 ¡ p5 ¡ p8 ¡ p2 ¡ p4 ¡ p7 ¡ p6 ¡

7!

7

Transitive property Alice posts p1 .

slide-8
SLIDE 8

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

8 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡

now ¡

slide-9
SLIDE 9

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

9 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡

1

slide-10
SLIDE 10

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

10 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡

discusses ¡

p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡

2

slide-11
SLIDE 11

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

11 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡

discusses ¡

p2 ¡ p4 ¡

discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡

3

slide-12
SLIDE 12

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

12 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡ p5 ¡

discusses ¡ discusses ¡

p2 ¡ p4 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

now ¡ now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡

5

The entire inference process is repeated each time the SR2

  • perator delivers

new RDF data

slide-13
SLIDE 13

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

13 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

slide-14
SLIDE 14

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

14 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

slide-15
SLIDE 15

http://streamreasoning.org/sr4ld2013

Naïve data-driven stream reasoning

§ Memo

15 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

The reasoner infers data that is irrelevant to query answering

slide-16
SLIDE 16

http://streamreasoning.org/sr4ld2013

Naïve query-driven (backward) stream reasoning § Memo

16

p1 ¡

now ¡

Reasoner RDF data

  • ntology

S2R SPARQL

slide-17
SLIDE 17

http://streamreasoning.org/sr4ld2013

§ Memo

17 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡

1

Naïve query-driven (backward) stream reasoning

slide-18
SLIDE 18

http://streamreasoning.org/sr4ld2013

§ Memo

18 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡

discusses ¡

p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡

2

Naïve query-driven (backward) stream reasoning

slide-19
SLIDE 19

http://streamreasoning.org/sr4ld2013

§ Memo

19 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡

discusses ¡

p2 ¡ p4 ¡

discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡

3

Naïve query-driven (backward) stream reasoning

slide-20
SLIDE 20

http://streamreasoning.org/sr4ld2013

§ Memo

20 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡ p5 ¡

discusses ¡ discusses ¡

p2 ¡ p4 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

now ¡ now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡

5

Naïve query-driven (backward) stream reasoning

The entire inference process is repeated each time the SR2

  • perator delivers

new RDF data

slide-21
SLIDE 21

http://streamreasoning.org/sr4ld2013

§ Memo

21 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

Naïve query-driven (backward) stream reasoning

slide-22
SLIDE 22

http://streamreasoning.org/sr4ld2013

§ Memo

22 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

Naïve query-driven (backward) stream reasoning

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

slide-23
SLIDE 23

http://streamreasoning.org/sr4ld2013

§ Memo

23 Reasoner RDF data SPARQL Inferred data

  • ntology

S2R

p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

Naïve query-driven (backward) stream reasoning

The backward reasoner would not even start!

slide-24
SLIDE 24

http://streamreasoning.org/sr4ld2013

Naïve query-driven stream reasoning by query rewriting § MEMO § It is not that straight forward :-(

  • Lack of a standard query language for DSMS and CEP
  • Lack of a well-understood operational semantics for DSMS

and CEP (cf. SECRET by I. Botan et al., PVLDB 3(1), 2010)

  • Lack of expressiveness in OWL2QL

– Temporal reasoning – Aggregates – Functions

24

  • ntology

Rewritten query Reasoner S2R SPARQL data

slide-25
SLIDE 25

http://streamreasoning.org/sr4ld2013

Not so naïve stream reasoning

§ Naïve data-driven approach § From snapshots to changes

  • What has just been inserted?
  • What has just been deleted?

25 Reasoner RDF data Inferred data

  • ntology

S2R Reasoner Inferred data

  • ntology

S2R insertions deletions

Incremental!!!

SPARQL SPARQL

slide-26
SLIDE 26

http://streamreasoning.org/sr4ld2013

Not so naïve stream reasoning

§ MEMO § The problem is that materialization (the result of data- driven processing) are very difficult to decrement efficiently.

  • State-of-the-art: DRed algorithm

– Over delete – Re-derive – Insert

26 Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL Ceri, S., Widom, J.: Deriving production rules for incremental view maintenance. In: Lohman,G.M., Sernadas, A., Camps, R. (eds.) VLDB, pp. 577–589. Morgan Kaufmann, San Francisco (1991)

slide-27
SLIDE 27

http://streamreasoning.org/sr4ld2013

DReD

§ Overestimation of deletion: Overestimates deletions by computing all direct consequences of a deletion. § Rederivation: Prunes those estimated deletions for which alternative derivations (via some other facts in the program) exist. § Insertion: Adds the new derivations that are consequences

  • f insertions to extensional predicates.

27

slide-28
SLIDE 28

http://streamreasoning.org/sr4ld2013

The Intuition of DRed Algorithm

§ Let’s assume that we have the following materialized graph § While inserts are not problematic, deletion are difficult to

  • handle. If we delete p2 discusses p1 (p2->p1), we have
  • verestimate the impact of the deletion and mark for

deletion p4->p1 that can be derived by p4->p2 and p2->p1

  • look for alternative derivation of p4->p1 and eventually

find the chain p4->p3 and p3->p1

28

p1 ¡ p2 ¡ p3 ¡ p4 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡ discusses ¡

p1 ¡ p2 ¡ p3 ¡ p4 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡ discusses ¡

p1 ¡ p3 ¡ p4 ¡

discusses ¡ discusses ¡ discusses ¡

slide-29
SLIDE 29

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

29

p1 ¡

now ¡

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

slide-30
SLIDE 30

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

30

p1 ¡ p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡

1

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

slide-31
SLIDE 31

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

31

p1 ¡ p3 ¡

discusses ¡

p2 ¡

discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡

2

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

slide-32
SLIDE 32

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

32

p1 ¡ p3 ¡

discusses ¡

p2 ¡ p4 ¡

discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡

3

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

slide-33
SLIDE 33

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

33

p1 ¡ p3 ¡ p5 ¡

discusses ¡ discusses ¡

p2 ¡ p4 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

now ¡ now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡

5

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

The inference process is performed incrementally

slide-34
SLIDE 34

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

34

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

The inference process is performed incrementally

slide-35
SLIDE 35

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

35

p1 ¡ p3 ¡ p5 ¡ p8 ¡

discusses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡ discusses ¡

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

7

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

No inference is required when nothing changes

slide-36
SLIDE 36

http://streamreasoning.org/sr4ld2013

Not so naïve data-driven stream reasoning

§ Memo

36

now ¡ 10 ¡min ¡ago ¡ 20 ¡min ¡ago ¡ 30 ¡min ¡ago ¡ 40 ¡min ¡ago ¡ 50 ¡min ¡ago ¡

Inference is required to processes deletions :-(

Reasoner Inferred data

  • ntology

S2R insertions deletions Incremental !!! SPARQL

p3 ¡ p5 ¡ p8 ¡

usses ¡ discusses ¡ discusses ¡

p2 ¡ p4 ¡ p7 ¡ p6 ¡

discusses ¡ discusses ¡ discusses ¡

slide-37
SLIDE 37

http://streamreasoning.org/sr4ld2013

Wrapping up Naïve Stream Reasoning

§ Data-driven is very expensive

  • It materializes the full RDF snapshot delivered by the S2R
  • perator
  • It infers data even if it is not relevant to the Q/A task

§ Query-driven (backward) is expensive

  • It infers only data relevant to the Q/A task
  • It does not benefits from data inferred for the previous

snapshot delivered by the S2R operator

§ Query-driven by query rewriting is problematic

  • Lack of a standard query language and well-understood
  • perational semantics for DSMS and CEP
  • Lack of expressiveness in OWL2QL

§ Not so naïve stream reasoning using DRed is practicable

  • The inference process is performed incrementally
  • No inference is required when nothing changes
  • Inference is required to processes deletions :-(

37

slide-38
SLIDE 38

Stream Reasoning For Linked Data

  • M. Balduini, J-P Calbimonte, O. Corcho,
  • D. Dell'Aglio, E. Della Valle, and J.Z. Pan

http://streamreasoning.org/sr4ld2013

Naive reasoning on RDF streams

Emanuele Della Valle emanuele.dellavalle@polimi.it http://emanueledellavalle.org