Der Blätterkatalog benötigt Javascript.
Bitte aktivieren Sie Javascript in Ihren Browser-Einstellungen.
The Blätterkatalog requires Javascript.
Please activate Javascript in your browser settings.
Nr 41 2023 www markttechnik de 21 Wo liegen momentan der Entwicklungsschwerpunkt bei Intel wenn es um KI geht? Wir schauen uns die Applikationsseite an uns geht es weniger um theoretische Performance-Nummern wie TFLOPS Und das ist absolut kein Marketing denn natürlich könnten wir eine Super-Engine bauen die auf irgendwelche Benchmarks optimiert ist am Ende des Tages aber nur den einen Benchmark wirklich super abbildet und wenn ich dann einen anderen ablaufen lasse oder eine wirkliche Anwendung dann schneidet diese Super-Engine schlecht ab Ein Beispiel Unsere Xeon-Max-CPUs bringen für manche Benchmarks keinen großen Unterschied zur normalen Architektur ohne integrierten HBM-Speicher Anmerkg der Red High-Bandwidth-Memory Bei anderen Anwendungen wiederum insbesondere im HPC-Bereich ist das Bytes FLOP-Verhältnis entscheidend Das heißt Wir bauen eine Architektur die für bestimmte Anwendungen eine um Faktor 2 oder mehr bessere Performance bringt aber in anderen Anwendungen eben nicht so viel Denn wenn wir uns mit solchen Anwendern unterhalten dann wird ganz klar eine Verbesserung auf der Speicherseite gefordert denen bringt eine höhere Leistung im Floating-Point-Bereich gar nichts Im HPC-Bereich HBM zu integrieren ist nicht wirklich neu Welche Entwicklungsrichtungen verfolgt Intel noch? Natürlich geht es auch bei uns darum flexible Architekturen zu entwickeln die auf der Chip-Ebene flexibel sind Das heißt dass wir uns überlegen welche Compute-Engine gut wäre welcher Speicher Im Detail kann ich darüber nicht reden aber es ist klar dass wir unsere drei Produktlinien nehmen und auf Basis derer – also Gaudi2 Xeon und die Data-Center-GPUs – unsere zukünftigen Produkte weiterentwickeln werden Das ist ein dynamischer Prozess aber es ist heute schon klar dass wir spezielle KIund GPU-Technologien in ein Produkt integrieren werden Man muss sich immer die Anwendung ansehen und dann entscheiden welche speziellen Rechenoperationen beschleunigt werden sollen wie die Speicher-Patterns ausschauen Dabei geht es nicht nur um die Frage wie viel HBM draufgepackt wird sondern es ist natürlich auch entscheidend wie viel Cache denn auch er trägt zur Beschleunigung bei Die nächste Frage ist wie und wie viele dieser Architekturen in einem Chip kombiniert werden und dann welche Kombinationsmöglichkeiten auf der nächsten Ebene bestehen Wir haben beispielsweise in die Gaudi2-Chips Ethernet-RoCE-Interfaces integriert die die Kommunikation dieser Chips untereinander übernehmen Wir setzen auf eine Standard-Technologie denn damit ist eine Skalierung einfacher und es hat auch Kostenvorteile Hinzu kommt noch dass es für die Systemhersteller oft einfacher ist mithilfe einer Standard-Technologie ihre Systeme aufzubauen anstatt sich in eine proprietäre Technologie einarbeiten zu müssen Auch in diesem Fall wird natürlich überlegt ob diese Technologien in zukünftigen Produkten weiterverwendet werden können Kommt Ethernet nicht langsam an seine Grenzen? Nein Im Gaudi2 sind Ethernet-Ports integriert über die die Vernetzung mit anderen Gaudi2-Prozessoren abgewickelt wird Und das ist absolut notwendig denn wenn ein Large-Language-Modell trainiert wird dann reicht eine Beschleunigungskarte nicht aus weder vom Speicher noch von der Rechenleistung her Das muss auf der Hardwareseite entsprechend unterstützt werden sodass wirklich Maschinen gebaut werden können die entsprechend skalieren Und genau das haben wir auch gezeigt die Skalierung von Gaudi2 ist in einigen wichtigen Anwendungsfällen und Clustergrößen nahezu linear und das kann ich eben mit Ethernet erreichen Konkurrierende Hersteller nutzen proprietäre Schnittstellen um die notwendige Bandbreite zu erhalten Ja aber wie gesagt bei Gaudi2 bekommen wir das mit Ethernet gut hin Wobei wir im GPU-Bereich Xe-Link nutzen also auch eine eher proprietäre Technik Auch das zeigt unser Prinzip Wir sind anwendungsgetrieben wir wollen Lösungen für eine breite Masse von Benutzern anbieten die dann auch vonseiten der Total Cost of Ownership her interessant sind Das Interview führte Iris Stroh „ Hinzu kommt noch dass es für die Systemhersteller oft einfacher ist mithilfe einer Standard-Technologie ihre Systeme aufzubauen anstatt sich in eine proprietäre Technologie einarbeiten zu müssen “ Anzeige