Self Adapting Numerical Software and Update on NetSolve ������������� ����������������������� 1 Outline � ��������������������������� � ��������������� • Current status � ���������� ����!��"��#�$����� • BiCG � ��%�&'�(���&)*������+�(&, • Middleware for ease of use on clusters � ���������������)�� � -��!����.)�!��*#���/�)�)�.������ 2 1
Self-Adapting Numerical Software (SANS) Effort � ����/�#")�0���������#�!����"��/����������/)*������ #�1������!����/*)������/�����������"�����#��/� � 2��!����3�/�#"�)���3���!�����������������)�����!������ �"�/���4#����"���#������ � '����)�����&�#"*���������*����� � (�/*���������������#������#������"��� � ���!�����5*�/14!���#�/�!�")��#��������"��#�$�!���*������ � �)������#�)���*����!��#")�#�������� � ���1��������!������������������0"������#")�#�������� Different Best TUNING Algorithms, Algorithm, SYSTEM Segment Sizes Segment Size Data Structure Data Structure Software Generation Strategy - ATLAS BLAS � %���#�������*!������������ � -��������#*)��")�������������� /�!�3��4!�������/����)*������ � ��1���6�78�#��*��������*�3� 1���"�����#��/��"���#����� ��������������)�9373�:�;�<��� � �*����!�#���*������� � =���>�#�!�)��������� "�����#��/�����������*�� "�����#��/��"�����##���������� �������� /����/�)�/�!�����#�/����� � %�/1�.������!���������� ��������!�*�����"���#����� )�.���� �"��#�$������ � ����)�9�/�/���#*)��")�� � �������!��������&���/� �"��#�$������@ � �*"����/�)�� � ��<��//��� � ���!��������.)��&�/�#"�)�� � �9�/�/�����*�� � ��!������������*��!�������� � (%�*����*���� �����*����&����!��/���& � �#�������/� �/�����������!�.�� ��)�.3� � �����������*�� ����#���/�3��/����3� �")�3� � ���"��������!�#���#�$����� ��.���3��/�)! <���*)�3��*��3? 4 2
ATLAS Matrix Multiply Intel Pentium 4 at 1.5 GHz – using SSE2 4500 %A�;7�.����)�"��*��������7 4000 Intel P4 1.5 GHz 32-bit SSE2 3500 Intel P4 1.5 GHz 64-bit SSE2 3000 Intel P4 1.5 GHz 2500 Mflop/s %A�BA�.����)�"��*��������7 2000 1500 %A�BA�.����)�"� 1000 500 0 100 200 300 400 500 600 700 800 900 1000 Size 5 6C9888����������#�DE�C8�F84 �)�"��GG Solving Large Sparse Non-Symmetric Systems of Linear Equations Using BiCG-Stab � �0�#")������"��#�$������ � &�#.������7���/�����"������������ 9�)��" � ��#")���������!�0��� � ��#���)����=�������>������������ �������)��" 6 3
Optimization of BiCG-Stab 10% - 20% Improvement !������"" !������" %����& $!!!"�� $!!!"#�� $�"�� $�"#�� �� #�� ������� ����� ���� ����� ����� ����� ����� ������� ������ ���� ����� ����� ������ ������ �������� ����� ����� ����� ����� ����� ����� �������� ����� ��� ����� ���� ����� ���� �������� ������� ������� ������ ������ ������� ������� ������ ������ ������ ����� ����� ������ ����� �������� ����� ����� ����� ����� ����� ����� �������� ����� ����� ����� ����� ��� ����� �������� ������ ������ ����� ����� ����� ������ ����� ����� ����� ����� ����� ����� ����� ����� ����� ����� ���� ����� ����� ����� 7 Split ADI Method � �������))�����#�����!������������"����"��.)�# � ��)*��������#�!�*#���$��!�����.)�/1� � H�))�/��!������!�DE�����������#����! H������D���D� �9 +���,I� �9 D+�J�,�� �9 �����"��/��!��������@� �9 ��D�+��� 7 , � �9� ���/���"3�5*������������������/�������� ��D�� 7� 0I� &������.����7�#����0���/�����"��������K 8 4
Performance Of L1Cache A 2 x Kernel Alpha EV/67 � ����!����7�/�))����� L� Matrix Vector Multiply ��*���� 500 � ���.)�/1�������/�"�*��� 400 M flop/s 300 "��1 200 � 98M��#"����#����.�� 100 ��#")���"��#�$����� 0 30 60 90 120 Size ATLAS Opt by Hand 9 LAPACK For Clusters � �!������#�1�������������*�����*��/)*�������� ��)���!�����#����0�"��.)�#�� � �����#")�������/����������)�/�))������%�&' � �1��!�/�������������/��#�/���������*��� .���!��������*���N��"��.)�#���!����������� ������������# � �����#������#�/�����������/���.��*��! � �"��#�$����������.������#�������)*���� � ������.*�������!�����������"��/���������!� /�))�/������������*)�� � �����������% ��)�.�������*���������))����� ")�����#� 10 5
User has problem to solve ( e.g. Ax = b) with the assistance of a numerical library Data (A,b) Answer (x) Application Library ( e.g. LAPACK, ScaLAPACK, PETSc,…) Big Picture… 11 User has problem to solve ( e.g. Ax = b) Natural Natural Data (A,b) Answer (x) Middleware Structured Structured Data (A’,b’) Answer (x’) Application Library ( e.g. LAPACK, ScaLAPACK, PETSc,…) Friendly intervention… 12 6
Recommend
More recommend