Supporting Information Management in Digital Libraries with - - PowerPoint PPT Presentation

supporting information management in digital libraries
SMART_READER_LITE
LIVE PREVIEW

Supporting Information Management in Digital Libraries with - - PowerPoint PPT Presentation

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Supporting Information Management in Digital Libraries with Map-based Interfaces Rudolf Mayer , Angela Roiger, Andreas Rauber Vienna University of


slide-1
SLIDE 1

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Supporting Information Management in Digital Libraries with Map-based Interfaces

Rudolf Mayer, Angela Roiger, Andreas Rauber

Vienna University of Technolgy http://www.ifs.tuwien.ac.at/~mayer

slide-2
SLIDE 2

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Outline

  • Overview on Self-Organising Map

– Principals

  • Maps of Digital Libraries

– Systems – Interaction – Semantic description

slide-3
SLIDE 3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23.11.2005 Semantics 2005 3

Self-Organizing Map

  • Unsupervised neural network model
  • Topology-preserving mapping from a high

to a low dimensional space

  • Offers cluster analysis, relationships
  • Overview over large, high-dimensional

datasets

  • Scalable
  • Stable
slide-4
SLIDE 4

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Self-Organizing Map: Architecture

Unit Modell/weight vectors

n-dim.

x1 x2 x3 n-dim.

Input &

  • utput space

(vectors) (2D map)

slide-5
SLIDE 5

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Self-Organizing Map

x

m(t+1) m(t)

Learning process – competitive learning

Input space Output space

slide-6
SLIDE 6

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Self-Organizing Map

Learning process

slide-7
SLIDE 7

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Self-Organizing Map

Learning process

slide-8
SLIDE 8

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Self-Organizing Map

Learning process

slide-9
SLIDE 9

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

SOMs in Digital Libraries

  • 1. Representation of Documents in Vector

Space

  • 2. Self-Organising Map training
  • 3. Interface application
  • Several systems / applications

– WEBSOM (Kohonen, IEEE TNN 2000) – SOMLib (Rauber, ECDL 99) – Newsmap (Chen, DSS 2005) – ...

slide-10
SLIDE 10

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

SOMs in Digital Libraries

  • Several systems / applications

– However, not many real-world applications

  • Need for better methods/techniques for

– User interaction with the map – Automatically describing and explaining the map to the user – Summarising the content / giving fast overview – Personalisation

slide-11
SLIDE 11

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Novel map interaction

  • Integration of map-based interface with

“traditional” Digital Library systems

  • Enables wealth of new ways of interaction

– Highlight query results on the map – Select documents/regions on the map – Find related documents – Helps distinguishing results – Get an overview of the collection using the map

  • Small-scale user study with promising results
slide-12
SLIDE 12

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Integration into Greenstone

Search results Map selection

Search Document list Map

slide-13
SLIDE 13

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

System: Research documentation

  • Digital Library of the Austrian Research
  • Combines ~15 universities in Austria in
  • ne central database
  • “Traditional” search via meta-data / full text
  • Alternative interface with Self-Organising

Map

– Visualisation of query results – Related documents – Exploration

slide-14
SLIDE 14

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

System: Research documentation

slide-15
SLIDE 15

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Describing & explaining the map

  • Users want to get a quick overview of

– Topics present in the collection – Their (relative) importance – Their correlations

  • Dominant approaches

– Visualisation techniques to indicate cluster structures – does not reveal content – Labelling – static; mainly based on map-units

slide-16
SLIDE 16

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Describing & explaining the map

Interactive & personalised approach to explore Digital Library contents:

  • Hierarchical clustering of the map to identify

topical clusters/regions

  • Automatic labelling of clusters & sub-clusters
  • Summarisation of identified clusters
  • Interactive mode to “browse” through clusters
  • Personalisation through manual Labelling
slide-17
SLIDE 17

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Demo: 20 Newsgroups

  • Benchmark Data set
  • 1000 Postings per

newsgroup

  • Hierarchies of

Newsgroups

  • Term indexing
  • SOM training
  • Hierarchical clustering

(Ward’s clustering)

slide-18
SLIDE 18

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Demo: 20 Newsgroups

slide-19
SLIDE 19

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-20
SLIDE 20

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-21
SLIDE 21

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-22
SLIDE 22

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-23
SLIDE 23

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-24
SLIDE 24

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-25
SLIDE 25

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-26
SLIDE 26

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-27
SLIDE 27

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-28
SLIDE 28

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Cluster+Labels

slide-29
SLIDE 29

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Describing & explaining the map

  • Labels might be still ambiguous / not

convey enough information

  • Assist understanding by automatic text

summarisation

– Summarise identified clusters / regions – Summarise manually selected documents

slide-30
SLIDE 30

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 Newsgroups: Summarisation

slide-31
SLIDE 31

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Conclusions

Maps can provide valuable alternative DL access, but

  • Need for novel interaction techniques
  • Semantic description of the map

– Labelling – Topical regions – Summarisation

  • (Advanced visualisations)
  • Integrated into one system