TV-Schnee ist für eine neugierige Künstliche Intelligenz einfach unwiderstehlich.

Einige der mächtigsten KI-Systeme unserer Zeit lernen, weil sie dafür von außen belohnt werden. Was dem Hund sein Leckerli oder dem strebsamen Schüler seine Note, ist für eine KI eine höhere Punktzahl oder ein gewonnenes Spiel.

OpenAIs Team-KI “Five” oder Googles Super-KI “Alpha Zero” wurden mit diesem Verfahren ausgebildet. In der Fachsprache heißt es bestärkendes Lernen.

Vom Menschen wissen wir jedoch, dass die intrinsische die extrinsische Motivation deutlich übertreffen und zu besseren Ergebnissen führen kann. Außerdem sinkt der Betreuungsaufwand für den Lernenden, da er sich Inhalte und Zusammenhänge eigenständig erschließt.

Wie verhält sich eine neugierige KI in Videospielen?

KI-Forscher von OpenAI und den Universitäten Berkeley und Edinburgh versuchten daher in einem Experiment, eine intrinsisch motivierte Künstliche Intelligenz zu entwickeln. Sie sollte Videospiele aus Neugierde erforschen.

Technisch übersetzten die Forscher Neugierde, indem sie die KI dafür belohnten, neuen Inhalt zu entdecken. Sie sagte den nächsten Bildausschnitt vorher und überprüfte dann ihre Vorhersage. Bei einer falschen Vorhersage galt der Inhalt als neu – Mission erfüllt.

Das Ergebnis: Die neugierige KI entwickelte Fähigkeiten in klassischen Spielen wie Super Mario Bros. und Pong. Insgesamt erforschte sie mehr als 50 Spiele. Einige davon konnte sie sogar erfolgreich beenden. Bei Super Mario passierte sie elf Level.

Eine Auswahl der Spiele, die die neugierige KI eigenständig erforschen durfte. Bild: Burda / OpenAI

Eine Auswahl der Spiele, die die neugierige KI eigenständig erforschen durfte. Bild: Burda / OpenAI

Faszination Fernsehen

Es entstanden allerdings auch ungewöhnliche Resultate: Zwei neugierige KIs spielten sich beim Pong-Duell den Ball lieber permanent volley zu, anstatt den Spielregeln zu folgen. Das eigentliche Ziel bei Pong ist es, den Ball am Gegner vorbeizuschießen.

Manchmal starb die KI absichtlich, um den Game-Over-Screen zu entdecken – auch das war für sie neuer Inhalt.

Und: Die KI-Neugierde lässt sich wie ihr menschliches Gegenstück sehr einfach mit einem TV-Gerät befriedigen.

In einem digitalen Labyrinth versteckten die Forscher einen Fernseher samt Fernbedienung. Sobald die KI den TV fand, blieb sie davor hängen und zappte auf der Suche nach neuen Inhalten durch die Kanäle.

Die Forscher zeigten zwar nur Schneegestöber. Doch für eine pixelanalysierende KI ohne grundlegendes Verständnis für Inhalt ist das offenbar ausreichend abwechslungsreich. Nur in Ausnahmefällen konnte sie sich wieder vom TV-Gerät lösen.

Die Neugierde der KI-Forscher, ob eine neugierige KI möglich ist, hat einen pragmatischen Hintergrund: Eine aus Neugierde effizient lernende KI bräuchte – wie Menschen – weniger Betreuung. Das wiederum würde den Aufwand für die Einrichtung des KI-Systems reduzieren.

Größere Lernprojekte wären möglich: Beispielsweise könnte die neugierige KI eigenständig Fehler in Videospielen oder in Programmiercode finden.


Tagesaktuelle und redaktionell ausgewählte Tech- und VR-Deals: Zur Übersicht
VRODO-Podcast #120: Cebit-Erinnerungen, Duplex-Menschen und KI-Vorurteile | Alle Podcast-Folgen


Unsere Artikel enthalten vereinzelt sogenannte Affiliate-Links. Bei einem Kauf über einen dieser Links erhalten wir eine kleine Provision. Der Kaufpreis bleibt gleich.