CS-463: Information Retrieval Systems ������������ �� !�"�#$�� %&��'!�(�� )*v�,��*�-���.�/0����o�2 Yannis Tzitzikas University of Crete CS-463,Spring 05 �������������� ������������������������ ��������� �������� ������� • �����α�� �������α� (Relevance Feedback) • ��α��α������ ����������� (Query Reformulation) • – ��α������� ���� (Term Reweighting) – �����α�� ( ��α����� ) ���� ����� (Query Expansion), ��α��α������ ����������� !�α �� ��α���"α���# $������ • – Optimal Query, Rochio Method, Ide Method, DeHi Method �����#!��� • %���� - α����α�� �������α� (Pseudo relevance feedback) • &�������� ��!#���"�� • �����α�� ����������� • – ���#"α�� '����� ( ����#��α ) ������� (Automatic Local Analysis) – �α������ ������� – �����α�� ���� ����� ����� (��α���� (Thesaurus-based Query Expansion) – ���#"α�� �α������ ������� (Automatic Global Analysis) – ��α�������� (��α���� (Statistical Thesaurus) CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 2 Retrieval 2005 1
������� • )α�α�������� #�� �� *������ ��� "�*α� � α�α+������ �α�α���� ���� *�#�� α�α��α��� ����α� ��� α�*��� ���� ���� ���� ������"���� �α ����� ��α���������� �!!�α�α • ������ – � *������ ��� !����+�� �� �����*#"��� ��� ������"���� �!!����� – �� �����#!�� ��� *����� "����� �α ��α����� α�# α��# ��� �����!�� – � α�*��� ���� ���� "����� �α ���α� ��� !����� � ��� ������ α�# α��� ��� �α ������ ( �α�α��!���α� ���� �� ���α ����� � �� ���� ��!α �!!�α�α ) • , α�*��� ���� ���� "����� �α �������� �� � �� �� ���������α ����α��� ��� ���������α��� α��!��� • ���!�� !�α ��*����� α���"�� ����� α���� ��� ������"α��� CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 3 Retrieval 2005 '�#��� ����"�� ����� (1) -������� ��� α�*���� ���� ����� (2) .���� )����� (3) -������� �α����α��� ���"���� (4) -������� α�!����"�� ( "������� ) α�������� • )α�α�������� – 'α (2) ,(3),(4) �*��� ��� "#��"� α�������"α ( ������+��� ��� α������� �α� ��� ��#"���� ����������� ) • �� �α ��������"� ��� (1) CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 4 Retrieval 2005 2
)����!!����� !�α -������� ��� ��*���� ���� ����� �α��!����� : ( α ) ��*����� ��� α�α����� ������ ��� ��� ������ ( � ) ��*����� ��� ��� ���ι���� ������ ( � 1) ��� �����+���α� ��α ����� ������� ��� α�α������α� ( � 2) ��� �����+���α� �� ��� �� ������� ��� �����!�� CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 5 Retrieval 2005 �������� �υ����ι�� (Relevance Feedback): , �α���� ���α • $��� ��� �α�����α�� ��� α�������"���� , ���������"� ��� *����� �� �����ι ��� �υ����ι� ��#� � ������#����� �!!����� ��� α�������� • .����"������"� α���� ��� ���������α !�α �α ����ι��υ����υ�� ��� ���� ���� • �α�#��� ��α��"��"� ��� *����� ��� α������� ��� α�α��α����"���� ���� ����� • � . � . � CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 6 Retrieval 2005 3
��*���������� !�α �����α�� �������α� Query String Revised Rankings ReRanked IR Query Documents System 1. Doc2 2. Doc4 Query 3. Doc5 Ranked 1. Doc1 Reformulation . 2. Doc2 Documents . 3. Doc3 1. Doc1 � � � � . 2. Doc2 � � � � . 3. Doc3 � � � � Feedback . . CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 7 Retrieval 2005 '"�"α�α ��� ��*����������� ��� �"�������α� User Interface user need Text Text Operations logical view logical view Query DB Manager Indexing Operations user feedback Module inverted file query Searching Index retrieved docs Text Database Ranking ranked docs CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 8 Retrieval 2005 4
http://nayana.ece.ucsb.edu/imsearch/imsearch.html q=bike CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 9 Retrieval 2005 ��������"α�α CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 10 Retrieval 2005 5
$α������"α ��� ���α� � CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 11 Retrieval 2005 �������� ��α��α����"���� ���� ����� CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 12 Retrieval 2005 6
�����α�� �������α� : ��α��α������ ���� ����� (Relevance Feedback: Query Reformulation) '�#��� α�α��α������� ��� ���� ����� "��� ��� α����α�� : • ������υ��� ��ω� (Term Reweighting) : – ������ ��� �α� � ��� #��� ��α ���α�� �!!�α�α �α� "����� ��� �α� � ��� #��� ��α "� - ���α�� �!!�α�α .. • ������� ���������� (Query Expansion): – !���"��� ��ω� ��ω� ���� ���� ���� ( � . * . α�# !����� ���α�� �!!�α�α ) • /���*��� ������ α�!#���"�� !�α ��α�α��α������ ���� ����� CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 13 Retrieval 2005 ��α��α������ ���� ����� ��� #ι��υ����ι�� $������ • , �������� ���� ���� (Optimal Query) – �� ��������"� #�� !����+��"� �� ������ C r ��ω� ��� ���α� � �!!����� . – , �α������ ���� ���� ( α��� ��� �α�α������ ���� ������ #�α �α ���α�� �!!�α�α �α� "#�� α��� ) �α ��α� : � � � 1 � 1 � � � q d d answer(q): � opt j j � � C N C � � � � d C d C r r j r j r Where N is the total number of documents. ���� #"�� ��� !����+��"� �� ������ C r , �α �����"� ��#0� ��� α�*��� ���� ���� �α� ������ ��� *����� . CS-463, Information Yannis Tzitzikas, U. of Crete, Spring 14 Retrieval 2005 7
Recommend
More recommend