Forschungsprojekt VIDETE entwickelt neue KI-Methoden für maschinelles Sehen
Was der Computer sieht, aber nicht versteht
DFKI. Im Forschungsprojekt VIDETE werden neue Verfahren der Künstlichen Intelligenz auf Basis neuronaler Netze entwickelt, damit Computer besser verstehen, was sie sehen. Die Herausforderungen, die sich für die neuen Anwendungen in den Bereichen Autonome Systeme, Industrie und Medizin stellen, sind vielfältig.
Das Sehen ist eine der wichtigsten Sinnesfähigkeiten des Menschen. Gerade das Bewegungssehen ist eine Glanzleistung des Gehirns. In Sekundenbruchteilen werden Wahrnehmungen verarbeitet und interpretiert. Dabei spielt ein Mix aus Eindrücken anderer sensorischer Systeme, beispielsweise vom Gleichgewichtsorgan oder dem Tastsinn, ebenso eine wichtige Rolle wie Erfahrung. Denn das Gehirn hat gelernt, dass etwa ein Fahrzeug nur größer oder kleiner erscheint, wenn es sich entfernt oder annähert, obwohl die tatsächliche Größe sich nicht verändert. Als Mensch können wir komplexe Szenarien, wie Verkehrssituationen, erfassen und auch relativ sicher einschätzen, obwohl Geschwindigkeit und Abstand von Fahrzeugen variieren, Objekte sich überlagern, nur teilweise erkannt werden können oder die Lichtverhältnisse sich ändern. Dabei kommt uns unser Wissen zugute. Denn wir haben erlernt, die Dynamik einzelner Objekte und damit solcher Situationen intuitiv zu verstehen.
Computern hingegen fehlt dieses Wissen zunächst. Im Grunde genommen klassifizieren sie, was ihre optischen Sensoren erfassen, anhand einer programmierten Methode in schnellen Abfolgen. Sie wissen aber nicht, wie es sich wirklich verhält. Sie können Objekte zwar erkennen, einigermaßen einordnen und gewisse Umweltbedingungen in ihre Berechnungen einbeziehen, aber die Gesamtheit einer Situation mit zahlreichen Akteuren in all ihren Abhängigkeiten und Unwägbarkeiten nicht tatsächlich verstehen. Klassische Methoden des Maschinellen Sehens (Computer Vision) reichen hierfür kaum aus.
Schon um einen Gegenstand und dessen Bewegung stabil dreidimensional zu erfassen, sind gegenwärtige Systeme zumeist auf mindestens drei Kameras angewiesen. Zudem sind schwierige Umgebungsbedingungen, wie Nebel, Dunkelheit oder Reflexionen, nach wie vor eine große Herausforderung.
Prof. Dr. Didier Stricker, Leiter des Forschungsbereichs Erweiterte Realität (Augmented Vision) am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI): „Mit VIDETE verfolgen wir das ambitionierte Ziel, eine robuste Erkennung dynamischer Objekte mit wenigen oder gar nur einer Kamera zu bewerkstelligen, bei möglichst niedrigem Energieverbrauch. Kleinste Sensoren mit geringer Rechenkapazität sollen verlässliche Ergebnisse liefern.“ ps
Autor:Jens Vollmer aus Wochenblatt Kaiserslautern |
Kommentare
Sie möchten kommentieren?
Sie möchten zur Diskussion beitragen? Melden Sie sich an, um Kommentare zu verfassen.