Bilderkennung / Deep Learning zur Bildbeschreibung

Problemstellung

Im Geschäftsfeld Datenmanagement wurde in Zusammenarbeit mit dem Technologiecenter ein Algorithmus entwickelt um Autoteile zu klassifizieren.

In dem Bereich der Korrosionsforschung wurden zur Dokumentation Autoteile bei unterschiedlicher Belichtung und aus verschiedenen Perspektiven fotografiert. So entstanden bislang ~70.000 Bilder. Um die Korrosionsfälle zu erforschen, war es notwendig die Bilder nach den verschiedenen abgebildeten Autoteilen zu klassifizieren. Der manuelle Aufwand hätte hier ca. 300h betragen.

 

Wie sind wir vorgegangen?

Wir haben für diesen Fall ein neuronales Netzwerk aufgebaut. Dieses wurde trainiert um die verschiedenen Fahrzeugteile zu erkennen und nach deren Position im Fahrzeug zu klassifizieren, zum Beispiel im Motorraum, Fahrzeugheck oder -Front, Insassenraum etc. Anschließend wurden die rund 70.000 Bilder nachprozessiert und optimal für das neuronale Netzwerk vorbereitet. Das neuronale Netzwerk kann diese Bilder mit einer 80%igen Genauigkeit erkennen und klassifizieren.

 

Eine Spur voraus!

Wir haben das trainierte neuronale Netzwerk auf einem Entwicklungssteuergerät zum Laufen gebracht. Hierfür wurde einen Nvidia Jetson Tx2 verwendet. Dieser Schritt wurde gegangen, um zukünftig in der Lage zu sein die Bilder schon bei der Aufnahme über eine Web-App zu klassifizieren und zu beschriften. Hierbei wurden die Aufnahmequellen flexibel gehalten (Computer, Mobiltelefon, Tablet oder Kamera).  Der Anwender macht mit der integrierten Kamera ein Bild, welches innerhalb von wenigen Sekunden klassifiziert wird. Als Rückmeldung erhält er die vier wahrscheinlichsten Klassifizierungen mit den jeweiligen Wahrscheinlichkeiten. Im Anschluss hat man die Möglichkeit, die Klassifizierung zu prüfen und im Falle eines Fehlers zu korrigieren. So erkennt das neuronale Netzwerk seinen Fehler und verbessert sich kontinuierlich im Laufe der Zeit.

Wir freuen uns auf die Zusammenarbeit!

zur Übersicht