Steven Minton, InferLink Corporation Sofus Macskassy, Fetch - - PowerPoint PPT Presentation

steven minton inferlink corporation sofus macskassy fetch
SMART_READER_LITE
LIVE PREVIEW

Steven Minton, InferLink Corporation Sofus Macskassy, Fetch - - PowerPoint PPT Presentation

Steven Minton, InferLink Corporation Sofus Macskassy, Fetch Technologies Peter LaMonica, Air Force Research Laboratories Kane See, InferLink Corporation Craig


slide-1
SLIDE 1

Steven ¡Minton, ¡InferLink ¡Corporation ¡ Sofus ¡Macskassy, ¡Fetch ¡Technologies ¡ Peter ¡LaMonica, ¡Air ¡Force ¡Research ¡Laboratories ¡ Kane ¡See, ¡InferLink ¡Corporation ¡ Craig ¡Knoblock, ¡USC/Information ¡Sciences ¡Inst. ¡ Greg ¡Barish, ¡Fetch ¡Technologies ¡ Matthew ¡Michelson, ¡Fetch ¡Technologies ¡ Ray ¡Liuzzi, ¡Raymond ¡Technologies ¡

slide-2
SLIDE 2

Steve ¡Minton, ¡InferLink ¡ Steve ¡Minton, ¡Fetch ¡Technologies ¡ Steven ¡Minton, ¡Stanford ¡University ¡ Steven ¡Minton, ¡ ¡Jonosboro ¡High ¡School ¡ Steven ¡Minton, ¡JAIR ¡ Steven ¡Minton, ¡convicted ¡felon ¡ Stephen ¡Minton, ¡Brain ¡Surgeon ¡

slide-3
SLIDE 3

¡ Application ¡domain: ¡Arms ¡trafficking ¡ ¡ Entity ¡Intelligence ¡Portal ¡(ENTEL) ¡ ¡ Entity ¡resolution ¡process ¡ ¡ Mistakes: ¡Maintaining ¡referential ¡integrity ¡

slide-4
SLIDE 4

AIJ ¡ ¡ ¡ ¡ ¡AAAI ¡ Grants.gov ¡

JAIR ¡

IEEE ¡Intelligent ¡Systems ¡

Web ¡Monitoring ¡System ¡ ICML ¡

slide-5
SLIDE 5

NASA ¡ ¡ ¡

InciWeb.org ¡ US ¡Forest ¡Service ¡

National ¡Interagency ¡Fire ¡Center ¡

Twitter ¡ Web ¡Monitoring ¡System ¡

slide-6
SLIDE 6

Banned ¡Airlines ¡ ¡ ¡ ¡ ¡

Air ¡Cargo ¡News ¡

Airliners.net ¡

Twitter ¡

Aviation ¡Week ¡

ATWonline ¡ Aviation ¡Safety ¡Network ¡

Web ¡Monitoring ¡System ¡

slide-7
SLIDE 7
slide-8
SLIDE 8

Charged ¡with ¡conspiracy ¡to ¡support ¡a ¡terrorist ¡organization, ¡money ¡laundering, ¡…., ¡

slide-9
SLIDE 9

Air ¡Cess ¡ ¡ Centrafricain ¡Airlines ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Air ¡Pass ¡ ¡ Great ¡Lake ¡Business ¡Company ¡ Galaxy ¡Air ¡ Anikay ¡(Anikai) ¡Airlines ¡ Irbis ¡Air ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Mega ¡Airlines ¡ Omega ¡Aircompany ¡ Phoenix ¡Aviation ¡ MaxAvia ¡ WING ¡AIR ¡ Click ¡Airways ¡ Aerocom ¡ ¡ JetLine ¡International ¡ Air ¡Mero ¡ ¡Dolphin ¡Air ¡ ¡ Flying ¡Dolphin ¡ Ishtar ¡Airlines ¡ African ¡Express ¡ Air ¡Leone ¡ Inter ¡Transavia ¡ Santa ¡Cruz ¡Imperial ¡ Air ¡Foyle ¡ Norse ¡Air ¡Charter ¡ Pietersberg ¡Aviation ¡Services ¡Systems ¡ Balkh ¡Airlines ¡ San ¡Air ¡General ¡Trading ¡ Air ¡Zory ¡ Sitrat ¡Air ¡ ¡Air ¡Bas ¡

slide-10
SLIDE 10

Registration ¡ Aircraft ¡Type ¡ Construction ¡ Nbr ¡ Previous ¡Reg. ¡ Sighting ¡ Markings ¡ UN-­‑75002 ¡ Ilyushin ¡18E ¡ 185008603 ¡ 3C-­‑KKR ¡ SHJ ¡11May03 ¡ SHJ ¡04Nov03 ¡ no ¡markings ¡ a/w, ¡n/t ¡ UN-­‑75003 ¡ Ilyushin ¡18V ¡ 184006903 ¡ 3C-­‑KKJ ¡ SHJ ¡12Oct03 ¡ blue ¡tail, ¡no ¡m/s ¡ UN-­‑75004 ¡ Ilyushin ¡18D ¡ 186009202 ¡ 3C-­‑KKK ¡ SHJ ¡14Sep02 ¡ SHJ ¡04Nov03 ¡ SHJ ¡28Dec03 ¡ green ¡cheatline ¡ and ¡blue ¡tail ¡ No ¡t/t, ¡blue ¡tail ¡ all ¡white ¡ UN-­‑75005 ¡ Ilyushin ¡18D ¡ 187010204 ¡ 3C-­‑KKL ¡ SHJ ¡04Nov03 ¡ UN-­‑11007 ¡ Antonov ¡12B ¡ 9346509 ¡ 3C-­‑OOZ ¡ SHJ ¡Oct02 ¡ SHJ ¡11May03 ¡ DXB ¡12Oct03 ¡ No ¡m/s ¡ all ¡white ¡c/s ¡ no ¡titles ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ [From ¡Ruudleeuw.com] ¡

slide-11
SLIDE 11
slide-12
SLIDE 12
slide-13
SLIDE 13
slide-14
SLIDE 14

Fetch ¡Agent ¡Platform™ ¡ (web ¡harvesting) ¡ Source ¡B ¡

Source ¡D ¡

Source ¡A ¡

Source ¡C ¡

Entitybase™ ¡

(entity ¡resolution) ¡

¡ Web ¡ GUI ¡ ¡

Facts ¡ Entity ¡IDs ¡

Fact ¡Extraction ¡

(entities, ¡facts, ¡relations ¡ from ¡unstructured ¡text) ¡ 1

2

3

Text ¡ Facts ¡

4 5

Analytics ¡Engine ¡and ¡ Entity-­‑Resolved ¡ Content ¡Store ¡ ¡ ¡ ¡ ¡ ¡

¡

WatchLists ¡ Social ¡Network ¡

Text ¡

OpenCalais ¡ Semantex ¡

slide-15
SLIDE 15
slide-16
SLIDE 16
slide-17
SLIDE 17
slide-18
SLIDE 18
slide-19
SLIDE 19
slide-20
SLIDE 20

¡ Entity ¡resolution: ¡ ¡Link ¡incoming ¡records ¡describing ¡the ¡same ¡

entity ¡from ¡multiple ¡sources ¡

¡

¡ Many ¡“common ¡sense” ¡issues, ¡for ¡instance: ¡ ▪ Multiple ¡formats ¡for ¡names, ¡addresses, ¡etc. ¡

▪ R.L. ¡Landes ¡vs. ¡Robert ¡Landes ¡

▪ Noisy, ¡incorrect ¡values ¡

▪ Landes ¡vs. ¡Landis ¡

▪ Multi-­‑valued ¡attributes ¡

▪ Landes ¡can ¡be ¡both ¡President ¡and ¡CEO ¡

▪ Aliases ¡and ¡Deception ¡ Robert ¡Landes, ¡CEO, ¡Fetch ¡Software ¡ ¡ ¡ ¡ ¡ ¡R. ¡Landis, ¡President, ¡Fetch ¡Technologies ¡

  • R. ¡Land, ¡CEO, ¡French ¡ ¡Alliance ¡Technologies ¡
slide-21
SLIDE 21
slide-22
SLIDE 22

Confidence ¡Threshold ¡ ¡ New ¡Record ¡ Cluster ¡is ¡a ¡ ¡ single ¡entity ¡ Composed ¡of ¡ multiple ¡data ¡records ¡ E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E7 ¡

slide-23
SLIDE 23

E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡R. ¡Landis, ¡ ¡ President, ¡Fetch ¡Tech ¡ ¡ ¡ ¡ ¡ ¡ ¡Robert ¡Landes, ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡CEO, ¡Fetch ¡Tech ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡R. ¡Land, ¡ ¡ ¡ ¡President, ¡French ¡Tech ¡ ¡ ¡ Transformations Initial: Robert → R. Spelling: Landes → Landis Title alias: CEO → President ¡ ¡ Transformations Spelling: Land → Landis Spelling: French→ Fetch ¡ ¡

slide-24
SLIDE 24

E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡R. ¡Landis, ¡ ¡ President, ¡Fetch ¡Tech ¡ ¡ ¡ ¡ ¡ ¡ ¡Robert ¡Landes, ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡CEO, ¡Fetch ¡Tech ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡R. ¡Land, ¡ ¡ ¡ ¡President, ¡French ¡Tech ¡ ¡ ¡

P(E1 ¡|D) ¡ ¡= ¡ ¡P(E1) ¡P(D ¡| ¡E2 ¡) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡P(D) ¡ P(E2 ¡|D) ¡= ¡P(E2) ¡P(D ¡| ¡E2 ¡) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡P(D) ¡ ¡

slide-25
SLIDE 25

E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡R. ¡Landis, ¡ ¡ President, ¡Fetch ¡Tech ¡ ? ¡ Enew ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡P(Enew) ¡P(D ¡| ¡Enew ¡) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡P(D) ¡ ¡

slide-26
SLIDE 26

New ¡Record ¡

slide-27
SLIDE 27

New ¡Record ¡

slide-28
SLIDE 28

New ¡Record ¡

slide-29
SLIDE 29

¡ Merge ¡example: ¡ § Air ¡Cess ¡and ¡Air ¡Bas ¡aircraft ¡ ¡ Split ¡example: ¡ § George ¡H. ¡W. ¡Bush ¡and ¡George ¡W. ¡Bush ¡ ¡

slide-30
SLIDE 30

E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E10 ¡

EntityBase ¡

slide-31
SLIDE 31

E3 ¡ E4 ¡ E5 ¡ E6 ¡ E10 ¡

EntityBase ¡

E2 ¡? ¡

slide-32
SLIDE 32

E3 ¡ E4 ¡ E5 ¡ E6 ¡ E10 ¡

EntityBase ¡

slide-33
SLIDE 33

E3 ¡ E4 ¡ E5 ¡ E6 ¡ E10 ¡

EntityBase ¡

D1 D2 D3 D4 D5 D6 D7 D8 D9

D10 D11 D12 D13

D6

slide-34
SLIDE 34

E3 ¡ E4 ¡ E5 ¡ E6 ¡ E10 ¡

EntityBase ¡

D1 D2 D3 D4 D5 D6 D7 D8 D9

D10 D11 D12 D13

Analytics ¡

¡ WatchList ¡ ¡

Kartiga Air (D9) Merpati Airlines (D11) Air Cess (D138)

…. ¡ ¡ ¡

¡ ¡

slide-35
SLIDE 35

E1 ¡ E2 ¡ E3 ¡ E4 ¡ E5 ¡ E6 ¡ E6 ¡ E10 ¡

EntityBase ¡ Analytics ¡

¡ “Social” ¡Network ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡

¡ ¡

¡ ¡ E1 ¡ E2 ¡ E34 ¡ E15 ¡ E9 ¡ E200 ¡ E91 ¡ Publish ¡ Merges/Splits ¡

slide-36
SLIDE 36

E3 ¡ E4 ¡ E5 ¡ E6 ¡ E6 ¡ E10 ¡

EntityBase ¡ Analytics ¡

¡ “Social” ¡Network ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡

¡ ¡

¡ ¡ E1 ¡ E2 ¡ E34 ¡ E15 ¡ E9 ¡ E200 ¡ E91 ¡ Publish ¡ Merges/Splits ¡ E10 ¡

slide-37
SLIDE 37

¡ Two ¡approaches: ¡ § Refer-­‑by-­‑Description ¡

▪ Indirect ¡reference: ¡Point ¡to ¡a ¡cluster ¡member ¡ ▪ Advantage: ¡Easy, ¡no ¡synchronization ¡necessary ¡ ▪ …But ¡limits ¡information ¡that ¡client ¡can ¡cache ¡

§ Refer-­‑by-­‑Identifier ¡

▪ Direct ¡reference: ¡Cluster ¡ID ¡ ▪ Advantage: ¡Client ¡can ¡cache ¡arbitrary ¡information ¡ ▪ …But ¡ ¡client ¡must ¡synch ¡with ¡EntityBase ¡and ¡maintain ¡ consistency ¡ ¡ ¡

slide-38
SLIDE 38

¡ ¡ ¡

¡ Vision: ¡Entity ¡Resolution ¡in ¡a ¡decentralized ¡world ¡

¡ E.g., ¡the ¡Semantic ¡Web ¡(Glaser, ¡Jaffri ¡& ¡Millard, ¡2009) ¡ ¡

Entity ¡Resolution ¡ Service ¡ Data ¡ Source ¡ Data ¡ Source ¡ Data ¡ Source ¡ a ¡ ¡ Client ¡ Client ¡ Client ¡

slide-39
SLIDE 39

¡ Entity ¡resolution ¡can ¡be ¡hard: ¡“AI ¡Complete” ¡ § Arms ¡trafficking ¡domain ¡ ¡ Entity ¡merges ¡and ¡splits ¡will ¡occur ¡ ¡ Entity ¡resolution ¡clients ¡must ¡be ¡designed ¡to ¡

deal ¡with ¡this ¡ ¡

¡ Two ¡strategies: ¡Refer-­‑by-­‑Description ¡and ¡

Refer-­‑by-­‑Identifier ¡

¡ System ¡status: ¡Being ¡evaluated ¡by ¡AF ¡

personnel ¡