Der Blätterkatalog benötigt Javascript.
Bitte aktivieren Sie Javascript in Ihren Browser-Einstellungen.
The Blätterkatalog requires Javascript.
Please activate Javascript in your browser settings.
Nr 41 2023 www markttechnik de 19 PCANminiPCIe FD CAN-FD -Interface für PCI Express Mini Erhältlich mit ein zwei oder vier Kanälen inkl Software APIs und Treiber für Windows und Linux PCAN-Diag FD Professionelles Handheld mit 2-Kanal-Oszilloskop zur Diagnose von CANund CAN-FD -Bussen auf physikalischer und Protokoll-Ebene Optional mit J1939-Support PCAN-Router FD Frei programmierbarer Router für CAN und CAN FD mit 2 Kanälen Erhältlich mit D-Suboder Phoenix-Anschlüssen inkl Entwicklungspaket You CAN get it Hardware und Software für CAN-Bus-Anwendungen… www peaksystem com Otto-Röhm-Str 69 64293 Darmstadt Germany Tel +49 6151 8173-20 Fax +49 6151 8173-29 info@peaksystem com Ir rt ü m er u n d t ec h n is ch e Än d er u n g en v o rb eh al te n etwas anderes Design als die Argonne-Maschine aber auch in diesem Fall werden unsere Xeonund Ponte-Vecchio-Komponenten genutzt Das zeigt dass schon viele Komponenten eingesetzt werden wie die Verfügbarkeit auf der Seite der OEMs aussieht kann ich aber natürlich nicht genau sagen aber von unserer Seite aus handelt es sich um ein verfügbares Produkt Und wie sieht es mit speziellen KI-Beschleunigern bei Intel aus? Da schicken wir unsere Habana Gaudi2 ins Rennen Dabei handelt es sich um die zweite Generation von KI-Prozessoren die sich speziell für Deep-Learning-Workloads eignen sowohl im Training als auch für das Inferenzieren Es geht dabei um Anwendungen die wirklich sehr viel Performance brauchen wie zum Beispiel Large-Language-Models und Generative AI Am Markt gibt es den Wunsch nach einem generischen Beschleuniger Denn die bevorzugten Algorithmen ändern sich waren früher beispielsweise CNNs das Aund Oin der Bildverarbeitung haben mittlerweile Transformer gezeigt dass sie sich ebenfalls hervorragend für diese Aufgaben eignen Die auf CNNs optimierten Beschleuniger eignen sich aber nicht für Transformer deshalb der Wunsch nach einer generischen Architektur Der Wunsch ist verständlich aber ich denke es wird immer ein Kontinuum geben Das heißt man fängt mit einer CPU an die prinzipiell alles kann spezielle Dinge aber nicht ganz so gut und dann werden dafür optimierte Komponenten entwickelt das ist das Design-Prinzip Wenn eine neue Computer-Architektur entwickelt wird müssen viele Sachen bedacht werden Der erste Punkt ist Welche Applikationen will ich damit abdecken? Ich kann heutzutage eine Engine bauen die hohe TFLOPS-Werte erreicht die sich am Ende für die Anwendungen aber trotzdem nicht so gut eignet Deswegen sind Benchmarks immer mit Vorsicht zu genießen Also wenn ich auf einen bestimmten Applikations-Bereich ziele dann muss ich mir natürlich überlegen Was steckt dahinter? Welche Rechenoperationen müssen durchgeführt werden wie sehen die Daten-Zugriffsmuster aus oder müssen viele Daten verändert werden all das wirkt sich auf die Architektur aus Das heißt Das Design-Prinzip umfasst immer einen bestimmten Applikationsbereich ein generischer Ansatz wird dabei schwierig Deshalb haben wir auch verschiedene Architekturen für verschiedene Szenarios entwickelt natürlich kann ich mit einem einzigen Ansatz nicht alles abdecken deswegen die drei Produktlinien Um auf Ihre ursprüngliche Frage zurückzukommen kann Intel eine generische Architektur bauen? Bis zu einem gewissen Grad ist das möglich Nehmen wir Gaudi2 als Beispiel dahinter stecken Tensor-Processing-Cores eine Engine die die Matrix-Operation wieder zusammenbringt etc Natürlich kann ich sagen ich optimiere meine Architektur auf spezielle Rechenoperationen aber es müssen auch die Datentypen beachtet werden Wenn ich von der Numerik rede dann brauche ich 64 bit Double Floating Point um eine Konvergenz zu erreichen Bei Deep Learning kann ich mit der Auflösung der Datentypen runtergehen weil ich auch mit Floating Point 16 vielleicht sogar mit Floating Point 8 Konvergenz erreiche Das macht den Unterschied in der Architektur aus und wir denken dass wir mit der Gaudi-Architektur eine Architektur haben die generisch genug ist für heutige und zukünftige Anforderungen im Deep Learning Dabei möchte ich betonen Es muss nicht nur die Hardware betrachtet werden sondern auch die Software die oftmals wenn Leute über die Architektur reden so ein bisschen ausgeblendet wird Und die Software ist enorm wichtig denn wenn die Software das nicht unterstützt was die Hardware kann bringt die gesamte Hardware nichts Meinen Sie in diesem Fall die Unterstützung seitens der KI-Frameworks? Auch wobei die Unterstützung von Frameworks ziemlich einfach ist Wichtig ist dass auch das unterstützt wird was dahinter liegt Sagen wir wir nutzen Resnet als Beispiel dann muss die Architektur die Operationen unterstützen die letztlich von so einem neuronalen Netzwerk ausgelöst werden CNNs lösen vielleicht andere Operationen aus als Transformer also muss ich mir überlegen wie kann ich eine Architektur bauen die nicht nur CNNs gut kann Nicht trivial denn die Entwicklungen im KI-Bereich schreiten extrem schnell voran Ja weil einfach klar wird dass mit diesen wie auch immer gearteten neuronalen Netzen viele Applikationsbereiche besser abgedeckt werden können bzw manche Applikationen werden damit überhaupt erst ermöglicht Bildverarbeitung gab es schon vor dem Aufkommen von KI aber auch hier wurde erkannt dass es mit KI einfach besser geht und das ist natürlich ein dynamischer Prozess