EKA2107D

#nojs_error { position: relative; font-family: Verdana, sans-serif; text-align: center; top: 40px; width: 450px; margin: 0 auto; border: 2px solid #fcb814; border-radius: 18px; color: #888888; font-size: 13px; } #nojs_error p { text-align: left; padding: 5px 20px; }

Der Blätterkatalog benötigt Javascript.
Bitte aktivieren Sie Javascript in Ihren Browser-Einstellungen.

The Blätterkatalog requires Javascript.
Please activate Javascript in your browser settings.

20 Elektronik automot ive Künstliche intelligenz Netzarchitektur namens »Capsule Neural Network« [4] Diese Netzarchitektur erschien vielversprechend und sollte dabei helfen die letzten Hindernisse zu überwinden vor denen EDAG bei der Bildentnebelung noch stand Die Netzarchitektur des CapsNet basiert auf einem Convolutional Neural Network CNN Das Hauptanwendungs gebiet von CNNs ist die Bildverarbeitung Durch ihre spezielle Funktionsweise ist die Anzahl der trainierbaren Parameter geringer als bei einem Fully Connected Neural Network weshalb sie bestens dazu geeignet sind Bilder zu verarbeiten Ein CNN extrahiert Merkmale aus der Eingabe indem es einen Filter über das Bild laufen lässt Die Einträge des Filters werden gelernt und die Merkmalsextraktion derart gesteuert dass sie maximal hilfreich für das bestmögliche Ergebnis ist Somit werden nicht alle Neuronen einer Schicht für die Berechnung eines Neurons in der nächsten verwendet sondern nur ein kleiner Teil Auf diese Art können Merkmale wie Augen Nase und Mund eines Gesichts extrahiert werden Wenn das Gesicht geneigt ist werden dieselben Merkmale in geneigter Stellung extrahiert Genau an diesem Punkt setzt das Capsule Neural Network an Bild 2 Im CapsNet werden zusätzliche Informationen zu den Merkmalen gespeichert Diese Informationen können beispielsweise die Neigung eines Kopfes oder auch die Strichdicke einer handgeschriebenen Ziffer darstellen Dadurch lässt sich die Anzahl unterschiedlicher Merkmale reduzieren und die Leistungsfähigkeit steigern Bild 3 Eine weitere Eigenschaft die das CapsNet neu in die Welt des Deep Learning mitbringt ist das sogenannte Routingby-Agreement Hierdurch werden Informationen nur an diejenigen Neuronen der nächsten Schicht weitergegeben die durch diese Merkmale am besten repräsentiert werden Hinton et al stellten das CapsNet am Beispiel der Klassifikation von handgeschriebenen Ziffern des MNIST-Datensatzes vor Die Performance des CapsNets war überraschend Die Klassifikationsperformance einzelner Ziffern war State of the Art und die Performance für überlappende Ziffern lag sogar da rüber Die Weiterentwicklung des SmoFod Aufgrund der neuartigen Funktionsweise des CapsNets sollte durch die Integration der CapsNet-Eigenschaften in SmoFod eine verbesserte Bildrekonstruktion erzielt werden Da das CapsNet auf eine Bildklassifikationsaufgabe ausgelegt war wurde zunächst die Netzarchitektur zum Zwecke einer Bildrekonstruktion abgeändert Für Rekonstruktionsaufgaben werden häufig Autoencoder verwendet Diese bestehen aus einem Encoder und einem Decoder Der Encoder codiert die Eingabedaten Die codierten Daten werden an einen Decoder übergeben der sie wieder in ihre Ursprungsform zurückführt Durch die Komprimierung der Daten werden die Merkmale erhalten die für die Rekonstruktion wichtig sind und alle anderen verworfen Es wurde eine neuartige Architektur auf Basis eines Autoencoders mit den Eigenschaften des CapsNets entwickelt Somit war der Autoencoder in der Lage zusätzliche Informationen zu den extrahierten Merkmalen zu speichern und zu entscheiden welche Neuronen welche Informationen erhalten sollen Es ließ sich eine deutliche Verbesserung der Ergebnisse im Vergleich zu dem zuvor implementierten Modell erzielen Diese Verbesserungen beziehen sich sowohl auf die Farbdarstellung der Ergebnisse sowie auf die Erkennungsraten des Objektklassifikators YOLO [6] Zur Berechnung der Ähnlichkeiten zwischen zwei Bildern wird oft der Peak-Wert des Signal-Rausch-Verhältnisses PSNR oder der Structural Similarity Index SSIM herangezogen Der PSNR ist eine pixelbasierte Metrik welche auf dem bekannten Mean Squared Error MSE beruht Der Nachteil von pixelbasierten Metriken ist dass Abhängigkeiten zwischen den Pixeln nicht berücksichtigt werden und daher nicht das Bild im Ganzen »gesehen« wird Der SSIM hingegen bezieht diese Abhängigkeiten in Form von Kontrast Helligkeit und Struktur Bild 3 Merkmalsextraktion mit Zusatzinformationen eines CapsNet in vereinfachter Darstellung [5] Bild 2 Merkmalsextraktion eines Convolutional Neural Network in vereinfachter Darstellung [5] Bild EDAG Bild E DA G Weiter >