outline
play

Outline - PDF document

Self Adapting Numerical Software and Update on NetSolve 1 Outline


  1. Self Adapting Numerical Software and Update on NetSolve ������������� ����������������������� 1 Outline � ��������������������������� � ��������������� • Current status � ���������� ����!��"��#�$����� • BiCG � ��%�&'�(���&)*������+�(&, • Middleware for ease of use on clusters � ���������������)�� � -��!����.)�!��*#���/�)�)�.������ 2 1

  2. Self-Adapting Numerical Software (SANS) Effort � ����/�#")�0���������#�!����"��/����������/)*������ #�1������!����/*)������/�����������"�����#��/� � 2��!����3�/�#"�)���3���!�����������������)�����!������ �"�/���4#����"���#������ � '����)�����&�#"*���������*����� � (�/*���������������#������#������"��� � ���!�����5*�/14!���#�/�!�")��#��������"��#�$�!���*������ � �)������#�)���*����!��#")�#�������� � ���1��������!������������������0"������#")�#�������� Different Best TUNING Algorithms, Algorithm, SYSTEM Segment Sizes Segment Size Data Structure Data Structure Software Generation Strategy - ATLAS BLAS � %���#�������*!������������ � -��������#*)��")�������������� /�!�3��4!�������/����)*������ � ��1���6�78�#��*��������*�3� 1���"�����#��/��"���#����� ��������������)�9373�:�;�<��� � �*����!�#���*������� � =���>�#�!�)��������� "�����#��/�����������*�� "�����#��/��"�����##���������� �������� /����/�)�/�!�����#�/����� � %�/1�.������!���������� ��������!�*�����"���#����� )�.���� �"��#�$������ � ����)�9�/�/���#*)��")�� � �������!��������&���/� �"��#�$������@ � �*"����/�)�� � ��<��//��� � ���!��������.)��&�/�#"�)�� � �9�/�/�����*�� � ��!������������*��!�������� � (%�*����*���� �����*����&����!��/���& � �#�������/� �/�����������!�.�� ��)�.3� � �����������*�� ����#���/�3��/����3� �")�3� � ���"��������!�#���#�$����� ��.���3��/�)! <���*)�3��*��3? 4 2

  3. ATLAS Matrix Multiply Intel Pentium 4 at 1.5 GHz – using SSE2 4500 %A�;7�.����)�"��*��������7 4000 Intel P4 1.5 GHz 32-bit SSE2 3500 Intel P4 1.5 GHz 64-bit SSE2 3000 Intel P4 1.5 GHz 2500 Mflop/s %A�BA�.����)�"��*��������7 2000 1500 %A�BA�.����)�"� 1000 500 0 100 200 300 400 500 600 700 800 900 1000 Size 5 6C9888����������#�DE�C8�F84 �)�"��GG Solving Large Sparse Non-Symmetric Systems of Linear Equations Using BiCG-Stab � �0�#")������"��#�$������ � &�#.������7���/�����"������������ 9�)��" � ��#")���������!�0��� � ��#���)����=�������>������������ �������)��" 6 3

  4. Optimization of BiCG-Stab 10% - 20% Improvement !������"" !������" %����& $!!!"�� $!!!"#�� $�"�� $�"#�� �� #�� ������� ����� ���� ����� ����� ����� ����� ������� ������ ���� ����� ����� ������ ������ �������� ����� ����� ����� ����� ����� ����� �������� ����� ��� ����� ���� ����� ���� �������� ������� ������� ������ ������ ������� ������� ������ ������ ������ ����� ����� ������ ����� �������� ����� ����� ����� ����� ����� ����� �������� ����� ����� ����� ����� ��� ����� �������� ������ ������ ����� ����� ����� ������ ����� ����� ����� ����� ����� ����� ����� ����� ����� ����� ���� ����� ����� ����� 7 Split ADI Method � �������))�����#�����!������������"����"��.)�# � ��)*��������#�!�*#���$��!�����.)�/1� � H�))�/��!������!�DE�����������#����! H������D���D� �9 +���,I� �9 D+�J�,�� �9 �����"��/��!��������@� �9 ��D�+��� 7 , � �9� ���/���"3�5*������������������/�������� ��D�� 7� 0I� &������.����7�#����0���/�����"��������K 8 4

  5. Performance Of L1Cache A 2 x Kernel Alpha EV/67 � ����!����7�/�))����� L� Matrix Vector Multiply ��*���� 500 � ���.)�/1�������/�"�*��� 400 M flop/s 300 "��1 200 � 98M��#"����#����.�� 100 ��#")���"��#�$����� 0 30 60 90 120 Size ATLAS Opt by Hand 9 LAPACK For Clusters � �!������#�1�������������*�����*��/)*�������� ��)���!�����#����0�"��.)�#�� � �����#")�������/����������)�/�))������%�&' � �1��!�/�������������/��#�/���������*��� .���!��������*���N��"��.)�#���!����������� ������������# � �����#������#�/�����������/���.��*��! � �"��#�$����������.������#�������)*���� � ������.*�������!�����������"��/���������!� /�))�/������������*)�� � �����������% ��)�.�������*���������))����� ")�����#� 10 5

  6. User has problem to solve ( e.g. Ax = b) with the assistance of a numerical library Data (A,b) Answer (x) Application Library ( e.g. LAPACK, ScaLAPACK, PETSc,…) Big Picture… 11 User has problem to solve ( e.g. Ax = b) Natural Natural Data (A,b) Answer (x) Middleware Structured Structured Data (A’,b’) Answer (x’) Application Library ( e.g. LAPACK, ScaLAPACK, PETSc,…) Friendly intervention… 12 6

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend