Collec&ve ¡En&ty ¡Resolu&on ¡in ¡ ¡ Rela&onal ¡Data ¡
CompSci ¡590.03 ¡ Instructor: ¡Ashwin ¡Machanavajjhala ¡ ¡
1 ¡ Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡
Collec&ve En&ty Resolu&on in Rela&onal Data - - PowerPoint PPT Presentation
Collec&ve En&ty Resolu&on in Rela&onal Data CompSci 590.03 Instructor: Ashwin Machanavajjhala Lecture 20 : 590.02 Spring 13 1 Recap:
1 ¡ Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 2 ¡
Hard ¡Constraint ¡ So8 ¡Constraint ¡ Posi&ve ¡Evidence ¡ Transi&vity: ¡x=y ¡& ¡y=z ¡=> ¡x=z ¡ ¡ Rela'onal: ¡If ¡x, ¡y ¡match ¡then ¡z, ¡w ¡are ¡ more ¡likely ¡to ¡match ¡ If ¡two ¡venues ¡match, ¡then ¡their ¡ papers ¡are ¡more ¡likely ¡to ¡match ¡ ¡ Nega&ve ¡Evidence ¡ Exclusivity: ¡x ¡and ¡y ¡must ¡refer ¡ to ¡dis&nct ¡en&&es ¡ ¡ Rela'onal: ¡If ¡x,y ¡don’t ¡match ¡ then ¡z,w ¡cannot ¡match ¡ If ¡two ¡venues ¡don’t ¡match, ¡ then ¡their ¡papers ¡don’t ¡ match ¡ SoU ¡Exclusivity: ¡x ¡and ¡y ¡are ¡very ¡likely ¡ different ¡elements ¡ ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 3 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 4 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 5 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 9 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 15 ¡
18 ¡
[Liben-‑Nowell ¡& ¡Kleinberg, ¡JASIST07] ¡ Set ¡of ¡a’s ¡neighbors ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 19 ¡
Can ¡be ¡any ¡kind ¡of ¡ shared ¡a`ributes ¡or ¡ ¡ rela&onships ¡to ¡shared ¡ en&&es ¡ ¡
20 ¡
[Adamic ¡& ¡Adar, ¡SN03] ¡ Overall ¡frequency ¡ in ¡the ¡data ¡ Can ¡be ¡any ¡kind ¡of ¡ shared ¡a`ributes ¡or ¡ ¡ rela&onships ¡to ¡shared ¡ en&&es ¡ ¡
21 ¡
Set ¡of ¡paths ¡between ¡ a ¡and ¡b ¡of ¡length ¡exactly ¡l Decay ¡factor ¡between ¡0 ¡and ¡1 ¡ ¢ Since ¡expensive ¡to ¡compute, ¡oUen ¡use ¡approximate ¡Katz, ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 22 ¡
23 ¡
[Jeh ¡& ¡Widom, ¡KDD02] ¡ Set ¡of ¡incoming ¡edges ¡into ¡a ¡ Decay ¡factor ¡between ¡0 ¡and ¡1 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 24 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 25 ¡
t:u v
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 26 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 27 ¡
(a)
v w u
(b)
(c)
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 28 ¡
t:(a,b) (x,x)
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 29 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 30 ¡
[Liben-‑Nowell, ¡Kleinberg ¡2003] ¡ Many ¡of ¡the ¡aforemen&oned ¡similarity ¡ func&ons ¡are ¡also ¡used ¡for ¡link ¡predic&on ¡ in ¡social ¡networks ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 31 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 32 ¡
P1: “JOSTLE: Partitioning of Unstructured Meshes for Massively Parallel Machines”, C. Walshaw, M. Cross, M. G. Everett, S. Johnson P2: “Partitioning Mapping of Unstructured Meshes to Parallel Machine Topologies”, C. Walshaw, M. Cross, M. G. Everett, S. Johnson, K. McManus P3: “Dynamic Mesh Partitioning: A Unied Optimisation and Load-Balancing Algorithm”, C. Walshaw, M. Cross, M. G. Everett P4: “Code Generation for Machines with Multiregister Operations”, Alfred V. Aho, Stephen C. Johnson, Jefferey D. Ullman P5: “Deterministic Parsing of Ambiguous Grammars”,
P6: “Compilers: Principles, Techniques, and Tools”, A. Aho, R. Sethi, J. Ullman
Alfred V. Aho Stephen C. Johnson Jefferey D. Ullman
Alfred V. Aho Stephen C. Johnson Jefferey D. Ullman
Alfred V. Aho Stephen C. Johnson Jefferey D. Ullman
Alfred V. Aho Stephen C. Johnson Jefferey D. Ullman
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 38 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 39 ¡
Lecture ¡20 ¡: ¡590.02 ¡Spring ¡13 ¡ 40 ¡