Bilderkennung: Google lernt sehen

(Bild: Google)

Menschen können komplexe visuelle Eindrücke mit wenigen Worten beschreiben. Google will seine Bilderkennung nun dazu bringen, ebenfalls Bildbeschreibungen in natürlicher Sprache zu erstellen. In Zukunft könnten dadurch die Suchmöglichkeiten enorm ausgeweitet werden.

Googles Forscher haben damit begonnen, eine Bilderkennung zu entwickeln, die Fotos beschreiben kann. Noch ist die Arbeit aber ganz am Anfang, liefert jedoch schon interessante Ergebnisse. Dabei kombiniert Google die digitale Bildverarbeitung mit computerisierten Sprachmodellen.

Die neue Technik soll Menschen mit Sehbehinderungen helfen, Bilder zu verstehen oder Alternativ-Texte für Websites automatisch zu generieren. Das wäre auch bei sehr langsamen Internetverbindungen hilfreich, meint Google. Die Bilder könnten dann weggelassen werden, ohne das wesentliche Informationen fehlen.

Das Hauptaugenmerk liegt aber auf der ganz gewöhnlichen Textsuche. Indiziert Google die Bildinhalte als Textbeschreibungen, könnte jeder Benutzer der Suchmaschine sie finden.

Wie funktioniert die elektronische Bildbeschreibung?

Google nennt seine neue Technik Neural Image Caption (Neutrale Bildbeschriftung). Sie ist eine Kombination aus zwei Verfahren – einem sogenannten rückgekoppelten neuralen Netzwerk (RNN) und einem „Convolutional Neural Network“ (CNN). Dabei wird einerseits versucht, Objekte in den vorgelegten Bildern zu erkennen und diese Informationen dann klassifiziert und mit natürlicher Sprache beschrieben. Dabei spielt es auch eine Rolle, wie wahrscheinlich es ist, dass die Objekte tatsächlich gemeinsam in der Szene vorkommen.

Das System ist darauf angewiesen, angelernt zu werden, um immer bessere Resultate zu erzielen. Am Ende stehen Bildbeschreibungen, die denen von Menschen nahe kommen sollen -hoffen Googles Forscher.

Tags :Quellen:google

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Advertising