Architektur paralleler Plattformen Freie Universitt Berlin - - PowerPoint PPT Presentation

architektur paralleler plattformen
SMART_READER_LITE
LIVE PREVIEW

Architektur paralleler Plattformen Freie Universitt Berlin - - PowerPoint PPT Presentation

Architektur paralleler Plattformen Freie Universitt Berlin Fachbereich Informatik Wintersemester 2012/2013 Proseminar Parallele Programmierung Mirco Semper, Marco Gester Datum: 31.10.12 Inhalt I. berblick ber die Prozessorentwicklung


slide-1
SLIDE 1

Architektur paralleler Plattformen

Freie Universität Berlin Fachbereich Informatik Wintersemester 2012/2013 Proseminar Parallele Programmierung Mirco Semper, Marco Gester Datum: 31.10.12

slide-2
SLIDE 2

Inhalt

I. Überblick über die Prozessorentwicklung II. Parallelität innerhalb eines Prozessorkerns III. Klassifizierung von Parallelrechnern

  • IV. Speicherorganisation

V. Verbindungsnetzwerke

Architektur paralleler Plattformen Teil 1 31.10.12

slide-3
SLIDE 3
  • I. ÜBERBLICK

PROZESSORENTWICKLUNG

Architektur paralleler Plattformen

Architektur paralleler Plattformen Teil 1 31.10.12

slide-4
SLIDE 4
  • I. Überblick Prozessorentwicklung
  • Zu Beginn Steigerung der Leistung primär über Taktrate
  • Parallel dazu Verbesserung der Architektur und Steigerung der

Transistorzahl

Quelle: http://njtechreviews.com/wp-content/uploads/2011/09/varian-moores-law-graph.gif Architektur paralleler Plattformen Teil 1 31.10.12

slide-5
SLIDE 5
  • I. Überblick Prozessorentwicklung
  • Ab 2005 Mehrkernprozessoren im privaten Bereich

Quelle: http://images.bit-tech.net/content_images/2011/01/intel-sandy-bridge-review/sandy-bridge-die-map.jpg

Architektur paralleler Plattformen Teil 1 31.10.12

slide-6
SLIDE 6
  • I. Überblick Prozessorentwicklung

Paralellität auf Bitebene

  • Steigerung ab 1986 auf 32 bit, ab Mitte der 90er 64 bit

Gründe: genauere Floating Point Operationen möglich größerer Ansprechbarer Adressraum

Architektur paralleler Plattformen Teil 1 31.10.12

slide-7
SLIDE 7
  • I. Überblick Prozessorentwicklung

Parallelität durch Pipelining

  • Aufteilung der Verarbeitung einer Instruktion in verschiedene Teile

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0

Architektur paralleler Plattformen Teil 1 31.10.12

slide-8
SLIDE 8
  • I. Überblick Prozessorentwicklung

Parallelität durch mehrere Funktionseinheiten

  • Es werden mehrere ALUs, FPUs und andere verbaut
  • Entwicklung sind Grenzen gesetzt, da hoher Scheduling Aufwand

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-9
SLIDE 9
  • I. Überblick Prozessorentwicklung

Parallelität auf Prozess und Threadebene

  • Echte Mehrkern Prozessoren

Jeder Kern ist vollständige CPU und beinhaltet alle zuvor besprochenen Prinzipien

Architektur paralleler Plattformen Teil 1 31.10.12

slide-10
SLIDE 10
  • II. PARALLELITÄT INNERHALB EINES

PROZESSORKERNS

Architektur paralleler Plattformen

Architektur paralleler Plattformen Teil 1 31.10.12

slide-11
SLIDE 11
  • II. Parallelität innerhalb eines

Prozessorkerns

VLIW (very long instruction word) Prozessoren

  • statisches Scheduling
  • Programmablauf schon vom Compiler festgelegt
  • wichtigstes Beispiel: IA64 Archtektur in Itanium Serverprozessoren

Quelle: http://cdn.slashgear.com/wp-content/uploads/2012/01/intel_itanium_2.jpg Architektur paralleler Plattformen Teil 1 31.10.12

slide-12
SLIDE 12
  • II. Parallelität innerhalb eines

Prozessorkerns

Superskalare Prozessoren

  • mehrere Instruktionen pro Zyklus
  • dynamisches Scheduling
  • Sicherstellung, dass Instruktionen in der richtigen Reihenfolge

fertig werden

Architektur paralleler Plattformen Teil 1 31.10.12

slide-13
SLIDE 13
  • II. Parallelität innerhalb eines

Prozessorkerns

Architektur paralleler Plattformen Teil 1 31.10.12 Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0

slide-14
SLIDE 14

KLASSIFIZIERUNG VON PARALLELRECHNERN

Architektur paralleler Plattformen

Architektur paralleler Plattformen Teil 1 31.10.12

slide-15
SLIDE 15
  • III. Klassifizierung von Parallelrechnern

Allgemeine Definition: Ein Parallelrechner ist eine Ansammlung von Berechnungseinheiten (Prozessoren), die durch koordinierte Zusammenarbeit große Probleme schnell lösen können Eine Klassifizierung nach wichtigen Charakteristika: Flynsche Klassifizierung

Architektur paralleler Plattformen Teil 1 31.10.12

slide-16
SLIDE 16
  • III. Klassifizierung von Parallelrechnern

SISD (single instruction single data)

  • klassischer von Neumann-Rechner

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-17
SLIDE 17
  • III. Klassifizierung von Parallelrechnern

MISD (multiple instruction single data)

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-18
SLIDE 18
  • III. Klassifizierung von Parallelrechnern

SIMD (single instruction multiple data)

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-19
SLIDE 19
  • III. Klassifizierung von Parallelrechnern

MIMD (multiple instruction multiple data)

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-20
SLIDE 20
  • IV. SPEICHERORGANISATION

Architektur paralleler Plattformen

Architektur paralleler Plattformen Teil 1 31.10.12

slide-21
SLIDE 21
  • IV. Speicherorganisation

Architektur paralleler Plattformen Teil 1 31.10.12

Speicherorganisation in Verteilten/Parallelen Systemen

Quelle: http://www.fbi.h- da.de/~a.schuette/Vorlesungen/VerteilteSysteme/Skript/1_Ueberblick/Ueber blick.pdf

slide-22
SLIDE 22
  • IV. Speicherorganisation

Rechner mit physikalisch verteiltem Speicher(Multicomputersysteme)

  • DMM(Distributed Memory Machine)

Architektur paralleler Plattformen Teil 1 31.10.12

Prozessor IO Speicher

Verbindungsnetzwerk

Knoten A Prozessor IO Speicher Knoten B

slide-23
SLIDE 23
  • IV. Speicherorganisation

Architektur paralleler Plattformen Teil 1 31.10.12

Prozessor IO Speicher Knoten A Prozessor IO Speicher Knoten B Sendebefehl Empfangs- befehl: Prozessor- Zugriff Speicherort

Kommunikation

slide-24
SLIDE 24
  • IV. Speicherorganisation

Architektur paralleler Plattformen Teil 1 31.10.12

Architektur verteilter Speicher

  • Kommunikation Punkt-zu-Punkt Verbindung
  • Puffer

Quelle: Parallele Programmierung, s.22 Abb. 2.5b Autoren: T. Rauber & G.Rünger

slide-25
SLIDE 25
  • IV. Speicherorganisation

Architektur verteilter Speicher

  • DMA(Direct Memory Access)
  • Lange Kommunikationswege

mithilfe von Software

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.22 Abb. 2.5c Autoren: T. Rauber & G.Rünger

slide-26
SLIDE 26
  • IV. Speicherorganisation

Architektur verteilter Speicher

  • verbesserte Kommunikationszeit
  • pro I/O Kanal maximal eine Nachricht
  • Pipelining der Nachrichten
  • Vermeidung von Deadlocks

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.22 Abb. 2.5e Autoren: T. Rauber & G.Rünger

slide-27
SLIDE 27
  • IV. Speicherorganisation

Vor-/Nachteile verteilter Speicher Vorteile: Nachteile:

  • Skalierbarkeit
  • Latenz
  • Kosteneffektivität
  • Lokalisierung der Daten
  • kein Cache Kohärenz

Protokoll

Architektur paralleler Plattformen Teil 1 31.10.12

slide-28
SLIDE 28
  • IV. Speicherorganisation

Vertreter Multicomputer

  • Cluster
  • Supercomputer
  • Verteilte Anwendungen übers Internet

Architektur paralleler Plattformen Teil 1 31.10.12

Quellen: Bild1: http://serverservice.sytes.net/?tag=mysql-cluster Bild2: http://farm4.static.flickr.com/3367/3615660625_6844933ea1_o.jpg

slide-29
SLIDE 29
  • IV. Speicherorganisation

Rechner mit physikalische gemeinsamem Speicher

  • Globaler/gemeinsamer Speicher
  • Load/Store
  • Shared Variables

Architektur paralleler Plattformen Teil 1 31.10.12

Gemeinsamer Adressraum

Quelle: Parallele Programmierung, s.25 Abb. 2.6a und b Autoren: T. Rauber & G.Rünger

slide-30
SLIDE 30
  • IV. Speicherorganisation

Symmetrische Multiprozessoren (SMP)

  • Seit 1980
  • Symmetrisch
  • Zentraler Bus
  • CPU Hopping
  • virtual shared memory

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.28 Abb. 2.7a Autoren: T. Rauber & G.Rünger

slide-31
SLIDE 31
  • IV. Speicherorganisation

Symmetrische Multiprozessoren (SMP)

  • UMA (Uniform Memory Access)
  • NUMA(Non Uniform Memory Access)
  • CC –NUMA (Cache Coherent NUMA)

Architektur paralleler Plattformen Teil 1 31.10.12

slide-32
SLIDE 32
  • IV. Speicherorganisation

Vor-/Nachteile gemeinsamer Speicher Vorteile: Nachteile:

  • Einfache Programmierung
  • Keine/schlechte

Skalierbarkeit

  • Kommunikation
  • Viele Cpu‘s sind schwierig

zu Implementieren

Architektur paralleler Plattformen Teil 1 31.10.12

slide-33
SLIDE 33
  • IV. Speicherorganisation

Reduktion von Speicherzugriffzeiten

  • Prozessorentwicklung
  • Speicherentwicklung

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.kreissl.info/ra_04.php

slide-34
SLIDE 34
  • IV. Speicherorganisation

Caches

  • Zwischen Hauptspeicher und CPU
  • Probleme bei Parallelität
  • l1,l2 und l3 Caches

Architektur paralleler Plattformen Teil 1 31.10.12

slide-35
SLIDE 35
  • IV. Speicherorganisation

Multithreading

  • Virtuelle Prozessoren
  • eigener PC und Registersatz pro virtuellem Kern
  • Kontextwechsel
  • Verzögerungszeit

Architektur paralleler Plattformen Teil 1 31.10.12

slide-36
SLIDE 36
  • IV. Speicherorganisation

Fine Grained Threading

  • Threadwechsel bei jedem

Zyklus

  • Nutzt nicht alle Resourcen

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.slcentral.com/articles/01/6/multithreading/page7.php

slide-37
SLIDE 37
  • IV. Speicherorganisation

Coarse Grained Threading

  • Wechselt nur bei

Verzögerung

  • Keine Verlangsamung des

Threads

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.slcentral.com/articles/01/6/multithreading/page6.php

slide-38
SLIDE 38
  • IV. Speicherorganisation

SMT/Hyperthreading

  • “Lücken“ füllen
  • Alle Threads

können alle Resourcen nutzen

  • Intel pentium 4 ht, i5-2400, i7 serie

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.slcentral.com/articles/01/6/multithreading/page8.php

slide-39
SLIDE 39
  • IV. Speicherorganisation

Hyperthreading (Intel)

  • 2 Logische Prozessoren
  • Weniger als 5% der

gesamten Chipfläche

  • replicated Resources
  • partitioned Resources
  • shared Resources

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.hartware.net/review_266_2.html

slide-40
SLIDE 40
  • IV. Speicherorganisation

Ablauf: 1.Beide logische Prozessoren sind IDLE 2.Thread 1 starten

  • 3. Thread 2 starten

4.Beide Threads werden beendet bevor neue geladen werden

Architektur paralleler Plattformen Teil 1 31.10.12

slide-41
SLIDE 41
  • IV. Speicherorganisation

Vor-/Nachteile Hyperthreading Vorteile: Nachteile:

  • Chipfläche
  • Programmierung
  • 30% Leistungssteigerung
  • Verwaltungsaufwand der

Kernel

Architektur paralleler Plattformen Teil 1 31.10.12

slide-42
SLIDE 42
  • V. VERBINDUNGSNETZWERKE

Architektur paralleler Plattformen

Architektur paralleler Plattformen Teil 1 31.10.12

slide-43
SLIDE 43
  • V. Verbindungsnetzwerke
  • Kommunikation
  • Topologie
  • Statische Ver-

bindungsnetzwerke

  • Dynamische Ver-

bindungsnetzwerke

  • Routingtechnik

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.ehrensenf.com/linktipps/schoener-kabelsalat

slide-44
SLIDE 44
  • V. Verbindungsnetzwerke

Bewertungskriterien für statische Netzwerke

  • Durchmesser
  • Grad
  • Bisektionsbandbreite
  • Knoten- und Kantenkonnektivität
  • Einbettung in andere Netzwerke

Architektur paralleler Plattformen Teil 1 31.10.12

slide-45
SLIDE 45
  • V. Verbindungsnetzwerke

Durchmesser

Architektur paralleler Plattformen Teil 1 31.10.12

slide-46
SLIDE 46
  • V. Verbindungsnetzwerke

Durchmesser Beispiel

Architektur paralleler Plattformen Teil 1 31.10.12

1 2 3 4 5 6 7 8 9 δ= δ(u,v) = 4

slide-47
SLIDE 47
  • V. Verbindungsnetzwerke

Grad

Architektur paralleler Plattformen Teil 1 31.10.12

slide-48
SLIDE 48
  • V. Verbindungsnetzwerke

Grad Beispiel:

Architektur paralleler Plattformen Teil 1 31.10.12

1 2 3 4 5 6 7 8 9 g(G)=4

slide-49
SLIDE 49
  • V. Verbindungsnetzwerke

Bisektionsbandbreite

Architektur paralleler Plattformen Teil 1 31.10.12

slide-50
SLIDE 50
  • V. Verbindungsnetzwerke

Bisektionsbandbreite Beispiel

Architektur paralleler Plattformen Teil 1 31.10.12

1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 B(G)= 4

slide-51
SLIDE 51
  • V. Verbindungsnetzwerke

Knotenkonnektivität

Architektur paralleler Plattformen Teil 1 31.10.12

slide-52
SLIDE 52
  • V. Verbindungsnetzwerke

Knotenkonnektivität Beispiel

Architektur paralleler Plattformen Teil 1 31.10.12

1 2 3 4 5 6 7 8 9 1 2 3 5 6 7 9 nc(G)=2

slide-53
SLIDE 53
  • V. Verbindungsnetzwerke

Kantenkonnektivität

Architektur paralleler Plattformen Teil 1 31.10.12

slide-54
SLIDE 54

Kantenkonnektivität Beispiel

Architektur paralleler Plattformen Teil 1 31.10.12

1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9

slide-55
SLIDE 55
  • V. Verbindungsnetzwerke

Anforderungen:

  • kleiner Durchmesser
  • geringer Grad
  • hohe Bisektionsbandbreite
  • hohe Konnektivität
  • Einbettung
  • Skalierbarkeit

Architektur paralleler Plattformen Teil 1 31.10.12

slide-56
SLIDE 56
  • V. Verbindungsnetzwerke

Vollständiger Graph Grad: n-1 Durchmesser: 1 Kantenkonnektivität: n-1 Bisektionsbandbreite: (n/2)²S

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9a Autoren: T. Rauber & G.Rünger

slide-57
SLIDE 57
  • V. Verbindungsnetzwerke

Lineares Feld Grad: 2 Durchmesser: n-1 Kantenkonnektivität: 1 Bisektionsbandbreite: 1

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9b Autoren: T. Rauber & G.Rünger

slide-58
SLIDE 58
  • V. Verbindungsnetzwerke

Ring Grad: 2 Durchmesser: Kantenkonnektivität: 2 Bisektionsbandbreite: 2

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9c Autoren: T. Rauber & G.Rünger

slide-59
SLIDE 59
  • V. Verbindungsnetzwerke

d-dimensionaler Gitter Grad: 2d Durchmesser: Kantenkonnektivität: d Bisektionsbandbreite:

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9d Autoren: T. Rauber & G.Rünger

slide-60
SLIDE 60
  • V. Verbindungsnetzwerke

d-dimensionaler Torus Grad: 2d Durchmesser: Kantenkonnektivität: 2d Bisektionsbandbreite:

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9e Autoren: T. Rauber & G.Rünger

slide-61
SLIDE 61
  • V. Verbindungsnetzwerke

k-dimensionaler Hyperwürfel Grad: log n Durchmesser: log n Kantenkonnektivität: log n Bisektionsbandbreite: n/2 Hamming Distanz

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9f Autoren: T. Rauber & G.Rünger

slide-62
SLIDE 62
  • V. Verbindungsnetzwerke

k-dimensionales CCC-Netzwerk Grad: 3 Durchmesser: Kantenkonnektivität: 3 Bisektionsbandbreite:

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9ag Autoren: T. Rauber & G.Rünger

slide-63
SLIDE 63
  • V. Verbindungsnetzwerke

Vollständiger binärer Baum Grad: 3 Durchmesser: Kantenkonnektivität: 1 Bisektionsbandbreite: 1

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: Parallele Programmierung, s.38 Abb. 2.9h Autoren: T. Rauber & G.Rünger

slide-64
SLIDE 64
  • V. Verbindungsnetzwerke

K-Computer

  • Platz 2 Top 500(10,51 pf)
  • 88.162 Cpu in 672 Schränken
  • Im November 2012 864

Schränke

  • Zeichnet sich besonders duch sein 6D Mesh/Torus

Verbindungsnetzwerk aus

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.n-tv.de/technik/Japan-hat-schnellsten-Rechner- article3619016.html

slide-65
SLIDE 65
  • V. Verbindungsnetzwerke

K-Computer Video: http://www.fujitsu.com/global/about/tech/k/whatis/network/

Architektur paralleler Plattformen Teil 1 31.10.12

Quelle: http://www.fujitsu.com/downloads/TC/sc10/interconnect-of-k- computer.pdf

slide-66
SLIDE 66
  • V. Verbindungsnetzwerke

Einbettung

  • Einbettung ist eine Abbildung der Knoten eines

Verbindungsnetzwerkes auf die Knoten eines Zielnetzwerkes mit einer anderen Topologie

  • Ausdehnung (oder Streckungsgrad) ist ein Maß für die Güte der

Einbettung Ausdehnung 1 = perfekt

Architektur paralleler Plattformen Teil 1 31.10.12

slide-67
SLIDE 67
  • V. Verbindungsnetzwerke

Beispiel 1: Einbettung eines Rings in einen k-dimensionalen Würfel

  • Methode:

Gespiegelter Gray-Code (RGC) rekursive Definition: Der k-bit Gray-Code wird aus dem (k-1)-Bit Gray-Code RGC(k-1) = (b1, …, bm) mit m= 2^k-1 konstruiert. Zur Konstruktion von RGC(k) wird RGC(k-1) dupliziert, vor jedes binäre Wort des Originals wird eine Null und vor jedes binäre Wort des Duplikats wird eine 1

  • gesetzt. Resultierende Folgen sind (0b1, …, 0bm) und (1b1, …, 1bm)

RGC(k) resultiert durch Umkehrung der zweiten Folge und Konkatenation.

Architektur paralleler Plattformen Teil 1 31.10.12

slide-68
SLIDE 68
  • V. Verbindungsnetzwerke

Beispiel 1: Einbettung eines Rings in einen k-dimensionalen Würfel

Architektur paralleler Plattformen Teil 1 31.10.12

slide-69
SLIDE 69
  • V. Verbindungsnetzwerke

Beispiel 2: 2-dimensionales Gitter in k-dimensionales Würfel

  • Verallgemeinerung der vorherigen Einbettung
  • Bildung von zwei Gray-Codes
  • Damit Erstellung einer Matrix

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-70
SLIDE 70
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke

  • Kompenenten sind an Eingangs-/Ausgansport des Netzwerkes

angeschlossen

  • keine direkten Punkt zu Punkt Verbindungen
  • nach Bedarf werden von aktiven Komponenten Verbindungen

hergestellt

Architektur paralleler Plattformen Teil 1 31.10.12

slide-71
SLIDE 71
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke Busnetzwerke

  • in jedem Computer zu finden
  • Bus besteht meistens aus sehr vielen Leitung um große

Datenmengen zu transportieren

  • immer nur ein Datentransport gleichzeitig

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-72
SLIDE 72
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke Crossbar-Netzwerke

  • Verbindungen durch Schalter
  • sehr aufwendig

Quelle: http://en.wikipedia.org/wiki/File:Crossbar-hy1.jpg Architektur paralleler Plattformen Teil 1 31.10.12

slide-73
SLIDE 73
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke Mehrstufige Schaltnetzwerke

  • aufgebaut aus mehreren Schichten aus Schaltern
  • Ziel ist geringerer tatsächlicher Abstand zwischen Prozessoren als

bei direkten Verbindungsnetzwerken

Quelle:Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-74
SLIDE 74
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke 16x16 Omega Netzwerk 16x16 Butterfly Netzwerk

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-75
SLIDE 75
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke IBM RP3

Quelle: http://www.sciencephoto.com/image/349994/530wm/T4500119-IBM_scientist_stands_by_RP3_parallel_processor-SPL.jpg Architektur paralleler Plattformen Teil 1 31.10.12

slide-76
SLIDE 76
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke 16x16 Baseline Fattree für 16 Prozessoren

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0 Architektur paralleler Plattformen Teil 1 31.10.12

slide-77
SLIDE 77
  • V. Verbindungsnetzwerke

Dynamische Verbindungsnetzwerke 3 dimensionales Benes-Netzwerk

Quelle: Parallele Programmierung Rauber, Rünger ISBN 978-3-642-13603-0

Architektur paralleler Plattformen Teil 1 31.10.12

slide-78
SLIDE 78

Architektur paralleler Plattformen Teil 1 31.10.12

Vielen Dank!