Der Blätterkatalog benötigt Javascript.
Bitte aktivieren Sie Javascript in Ihren Browser-Einstellungen.
The Blätterkatalog requires Javascript.
Please activate Javascript in your browser settings.
42 Elektronik 0 9 2024 Mikrocontroller und Prozessoren Insbesondere die hochflexible Pruning-Unterstützungstechnologie von Renesas f lexible N M Pruning-Technologie kann die Anzahl der Operat ionszyklen als Reaktion auf Änderungen der lokalen Pruning-Rate in KI-Modellen dynamisch anpassen Dies ermöglicht eine Feinsteuerung der Pruning-Rate je nach Le i s t ungsau f nahme Betr iebsgeschwindigkeit und Erkennungsgenauigkeit wie sie die Anwender jeweils benötigen Mit diesem Ansatz kann die Anzahl der Verarbeitungszyklen für KI-Modelle um mindestens 1 16 und die Leistungsaufnahme um mindestens 1 8 reduziert werden Heterogene Architektur mit gemeinsamem Betrieb von DRP-AI3 DRP und CPUs Serviceroboter beispielsweise benötigen eine hochentwickelte KI-Verarbeitung um die Umgebung zu erkennen Andererseits ist auch eine algorithmusbasierte Verarbeitung ganz ohne KI erforderlich um das Verhalten des Roboters zu bestimmen und zu steuern Aktuelle Embedded-Prozessoren CPUs verfügen jedoch nicht über ausreichende Ressourcen um diese verschiedenen Verarbeitungsarten in Echtzeit durchzuführen Renesas hat dieses Problem durch die Entwicklung einer heterogenen Architektur gelöst Hierbei arbeiten der dynamisch rekonfigurierbare Prozessor DRP der KI-Beschleuniger DRP-AI3 und die CPU zusammen Wie Bild 1 zeigt kann der DRP Anwendungen ausführen und dabei die Schaltungskonfiguration der Recheneinheiten auf dem Chip bei jedem Betriebstakt entsprechend dem zu verarbeitenden Inhalt dynamisch schalten Der DRP verbraucht weniger Strom als eine CPU und kann eine höhere Geschwindigkeit erreichen da nur die erforderlichen Rechenschaltungen genutzt werden Im Vergleich zu CPUs deren Leistung durch häufige externe Speicherzugriffe aufgrund von Cache-Fehlern und anderen Faktoren beeinträchtigt wird kann der DRP außerdem die erforderlichen Datenpfade in Hardware aufbauen Dadurch lassen sich Leistungseinbußen minimieren und Schwankungen der Betriebsgeschwindigkeit Jitter aufgrund von Speicherzugriffen verringern Der DRP verfügt auch über eine dynamisch rekonfigurierbare Funktion die die Verbindungen der Schaltkreise bei jeder Änderung des Algorithmus verändern kann Dies ermöglicht eine Verarbeitung mit begrenzten Hardwareressourcen selbst bei Roboteranwendungen die eine Verarbeitung mehrerer Algorithmen erfordern Der DRP ist besonders effektiv bei der Verarbeitung von Streaming-Daten wie der Bilderkennung bei der Parallelisierung und Pipelining die Leistung direkt verbessern Andererseits erfordern Programme wie die Entscheidungsfindung und Steuerung des Roboterverhaltens eine präzise Verarbeitung um auf sich ändernde Bedingungen und Veränderungen in der Umgebung reagieren zu können Hierfür ist eine Softwareverarbeitung in der CPU möglicherweise besser geeignet als eine Verarbeitung in Bild 4 Heterogene Architektur beschleunigt die Bilderkennungsverarbeitung – Testchip-Messung Bild Renesas Electronics Bild 3 Vergleich der gemessenen Spitzenleistung des DRP-AI3 Bild Renesas Electronics