�������� ����� � ���������������������� ����������������������������� � ���������������������������������� � ����������������������������������� ������������ � �������������� � �������������������������� � ���������������������� Data Mining Lecture 3: Classification 1 2 ���������������������� �������������� �!��������� � �� ����������������������������������������� � �� ����������������!�"� # $� % $&$� � ' ������������� �����������������!�"� # $&$� � '$��(�� / 0��(������������������������������������$�������� �(�����������������(�������, ���������������������� �����������������))���� � 1����������� ���������������������������������� �*� � � +(�������(�� � ������������������������, ����(�� �����������(�������������, � -�������$����� ������ ����� �.�� ������ ������� , � ����*�)�� ������������� ���������(�������� ����������������������������������)�������, � ���������� �������������)������$������������ / -��������� ����������������������(���������������(�� ��+������(� �������������������������� �����,�2������$��(���� ����������������� ���������� �������, ����������������������$�+��(���������������������� �������(����������������������������� ����������, Data Mining Lecture 3: Classification 1 3 Data Mining Lecture 3: Classification 1 4 "����������#�������������������$ %���&�������������������������$� � ������������������������������������ Tid Attrib1 Attrib2 Attrib3 Class Learning ��������� 1 Yes Large 125K No algorithm 2 No Medium 100K No 3 No Small 70K No 4 Yes Medium 120K No Induction � ������������������������������������� 5 No Large 95K Yes 6 No Medium 60K No ��������������������������� Learn No 7 Yes Large 220K 8 No Small 85K Yes Model 9 No Medium 75K No � ������������������������������������ 10 No Small 90K Yes 10 Model Training Set )������������)(��(���3$�������(���$���� Apply ����������� Model Tid Attrib1 Attrib2 Attrib3 Class ? 11 No Small 55K 12 Yes Medium 80K ? Deduction � ��������4������+��������������������$� 13 Yes Large 110K ? 14 No Small 95K ? +���(��$��������������$��)����$���� 15 No Large 67K ? 10 Test Set Data Mining Lecture 3: Classification 1 5 Data Mining Lecture 3: Classification 1 6 1
'�������������������%���&��� ���������������%���&�� �(�����#�%���� � �����������������5�����������6�$��$����2,� x � 7�����������(���������)������������������, � 7��3�9!�%:��(���������!�6� <28 >=28 � �������������8��������$�8��)$��������, � 7��#:�;!�3�;�%:��(���������!�� x VG � 7������������ �������+��(�����������8�,� � 7��3�;�#:��(���������!�2 � ���������)���(������������, <18 >=18 � ��������)������������������, U G Data Mining Lecture 3: Classification 1 7 Data Mining Lecture 3: Classification 1 8 ���������������%���&�� ��������)���#������ ������������������������� *&&����� / ��������)����������������� ������������������ View letters as constructed from 5 components: ������������������8��+������������������ �3)�����, / -))����������� ���)��������+�����, ����������������)���������, Letter A Letter B <��������������(��.����������������������������$� Letter C Letter D ����������+��8�������$����������������� ����������������������������(���, Letter E Letter F Data Mining Lecture 3: Classification 1 9 Data Mining Lecture 3: Classification 1 10 !������#�������� "����������������������� � <����������� 10 / 7����� Distance Based / ��)�����+��(��������� ���� Class A � =�����������>������������������������ 10 x x � <�������������������� 5 x x Class A x / ������������������������������������ Class B Class C x 5 x / ���������������3 x x x x 0 1 2 3 4 5 6 7 8 x x x x x Class C Class B x Partitioning Based 0 1 2 3 4 5 6 7 8 Data Mining Lecture 3: Classification 1 11 Data Mining Lecture 3: Classification 1 12 2
Recommend
More recommend