Kurz vor Googles 20-jährigem Jubiläum sprach Suchmaschinen-Chef Ben Gomes über die Rolle Künstlicher Intelligenz für sprechende Computer und Spracherkennung.

Googles Sprachsuche-App startete im Jahr 2011 mit Android 2.2 als Mindestvoraussetzung. Seitdem hat sich die darin integrierte Sprach-KI stetig weiterentwickelt. Mittlerweile ist sie über Googles KI-Assistenten weltweit auf Millionen Smartphones verbreitet. Die nächste Ausbaustufe ragt in das Leben anderer Menschen hinein: Die Telefon-KI Duplex erledigt täuschend echte Anrufe.

Für Google sind verbesserte Sprachdienste der nächste große Schritt in der KI-Entwicklung. Gomes geht noch weiter: Fortschritte in der maschinellen Verarbeitung natürlicher Sprache seien essenziell für die Zukunft des Internets, betont er im Interview mit dem Guardian.

„Spracherkennung und Sprachverständnis sind für die Zukunft von Suche und Information von zentraler Bedeutung”, sagt Gomes. “Aber es gibt viele komplexe Herausforderungen.”

Es sei zum Beispiel schwierig zu erkennen, worauf sich ein „er“, „sie“ oder „es“ in einem Satz bezieht – und in der Sprache existierten Millionen solcher komplexer Kontextformulierungen.

Sprachdienste in Entwicklungsländern bereits Alltag

Spracherkennung sei gerade in Entwicklungsländern mit geringer Alphabetisierungsrate ein wichtiger Teil des täglichen Lebens. Denn für viele Sprachen, die in Ländern wie Indien gesprochen werden, gebe es keine Standardtastatur.

„Ich habe zehn Jahre lang Hindi gelernt, aber ich wüsste nicht, wie man es schreibt – es ist also viel einfacher, seine Stimme zu nutzen, als zu schreiben“, sagt Gomes.

Spracherkennung werde im Westen immer noch als neue Technologie verstanden. Aber in Ländern wie Indien sei sie bereits so selbstverständlich und notwendig wie hier Smartphone-Tastaturen.

Im Gespräch mit Herrn Google

Damit Sprach-KIs die Erwartungen erfüllen, müssten noch viele Hürden genommen werden. Zum Beispiel würden Menschen mit Expertenwissen ganz anders suchen als ohne.

Um dem Nutzer Zugang zu den richtigen Informationen zu geben, muss Google daher die Suchanfrage des Laien mit der des Experten verknüpfen können. Laut Gomes hat es etwa fünf Jahre gedauert, bis Google mit dem Ergebnis zufrieden war.

Für ein echtes maschinelles Verständnis von menschlicher Sprache müsse noch viel geforscht und entwickelt werden. Erst mit diesem Verständnis werde es einfacher, mit Sprache bestimmte Informationen zu finden.

„Wir werden in der Lage sein, wesentlich komplexere Anfragen auf vielfältigeren Wegen zu stellen. Irgendwann kann man ein Gespräch mit Google führen“, so Gomes

Bemerkenswerte Fortschritte in der Forschung

Jüngste Fortschritte in der Entwicklung von Sprach-KIs könnte Gomes Vorhersage schneller Realität werden lassen als erwartet.

KI-Sprachforscher haben sich in den letzten Jahren vermehrt dem unüberwachten Lernen zugewandt und eine neue Generation Sprach-KIs geschaffen.

Beim unüberwachten Lernen müssen Trainingsdaten nicht aufwendig durch Menschen vorbereitet werden – das war bislang der Flaschenhals der Spracherkennungsforschung.

Mit dieser Lernmethode können neuronale Netze aus großen Textmengen – zum Beispiel Texte aus dem Internet – eigenständig ein Sprachmodell erstellen. Das Sprachmodell wird anschließend als Grundlage für die Lösung verschiedenster Spracherkennungsprobleme genutzt.

Für Open-AI Mitgründer Ilya Sutskever ist diese Entwicklung ein Durchbruch bei der Entwicklung sprechender Computer: „Unser Modell ist eine der größten Innovationen in der Erforschung neuronaler Netze in den letzten Jahren.“

Die Einführung dieser Methode hat bei manchen Sprachaufgaben zu einer um 25 Prozent verbesserten Erfolgsquote geführt. Das ist ein großer Sprung für ein Forschungsfeld, das lange Zeit auf der Stelle trat.


Tagesaktuelle und redaktionell ausgewählte Tech- und VR-Deals: Zur Übersicht
VRODO-Podcast #120: Cebit-Erinnerungen, Duplex-Menschen und KI-Vorurteile | Alle Podcast-Folgen


Unsere Artikel enthalten vereinzelt sogenannte Affiliate-Links. Bei einem Kauf über einen dieser Links erhalten wir eine kleine Provision. Der Kaufpreis bleibt gleich.