0

Googles neue Super-KI lernt in 40 Tagen tausende Jahre menschliches Wissen

von Matthias Bastian19. Oktober 2017

Das komplexe Brettspiel Go ist unwiederbringlich an die Maschinen verloren: Die neue KI AlphaGo Zero von Googles Deepmind übertrumpft den alten KI-Champion AlphaGo um ein Vielfaches.

Für die KI-Forschung war es ein Durchbruch wie die Mondlandung für die Raumfahrt: Im März 2016 besiegte Googles Künstliche Intelligenz AlphaGo den südkoreanischen Go-Meister Lee Sedol. AlphaGo lernte das Spiel durch die Analyse von Millionen menschlicher Spielzüge und basierend darauf genauer Vorhersagen des Spielverlaufs.

Die Nachfolgeintelligenz AlphaGo Zero benötigt diese menschliche Vorlage nicht mehr. Sie lernt die richtigen Spielzüge von Grund auf, indem sie das Go-Spiel gegen sich selbst trainiert. Die KI startete ohne Vorwissen in die erste Go-Partie, nur mit einem “mächtigen Suchalgorithmus” ausgestattet. Während der Partie aktualisierte sich Zero selbst und lernte, Spielzüge vorherzusehen.

Eine gewonnene Partie wurde mit Punkten belohnt und das neue Wissen war Ausgangsbasis für das nächste Go-Match gegen sich selbst. So verbesserte Zero das eigene Spielgeschick kontinuierlich. Laut Google gab es – von der anfänglichen Codierung abgesehen – keine menschliche Einmischung in den Lernprozess. Historische Daten wurden nicht benötigt.

In drei Tagen war Zero auf dem Niveau des Vorgängers, der Lee Sedol besiegte, und bügelte ihn in 100 Go-Partien hundertmal weg. Einen Wissensstand, für den die Menschheit laut Google tausende Jahre gelernt habe, erreichte Zero in wenigen Tagen. Insgesamt trainierte die KI 40 Tage, am Ende konnte sie die bis dato mächtigste Version von AlphaGo in 90 Prozent der Partien besiegen.

GIF

Zusätzlich soll Zero neues Wissen entdeckt haben, unkonventionelle und kreative Strategien, die den bisherigen Spielmanövern von AlphaGo überlegen sind. Noch dazu ist Zero Go effizienter als die Vorgänger-KI, kombiniert zwei neuronale Netze in eines und verbraucht dabei weniger Rechenleistung.

Menschliche Intelligenz als Störfaktor

Laut dem Deepmind-Mitgründer Demis Hassabis ist AlphaGo Zero so mächtig, da die KI nicht länger von der eingeschränkten menschlichen Intelligenz zurückgehalten wurde. Stattdessen lernte Zero vom besten maschinellen Go-Spieler: Sich selbst.

Natürlich entwickelte Google den mächtigen Algorithmus nicht, um die Menschheit beim Go-Spiel zu knechten. Hassabis beschreibt die große Vision: “Wir wollen mit solchen algorithmischen Durchbrüchen die großen Krankheiten heilen, so wie Alzheimer”, schreibt der KI-Forscher. Das KI-System könne innerhalb von Wochen Heilungen für Krankheiten finden, für die Menschen hunderte Jahre forschen müssten.

Die KI-Spezialisten von Deepmind versuchen das zu erreichen, was KI-Kritiker den künstlichen Gehirnen häufig vorwerfen, nämlich dass sie nur für spezifische Anwendungsszenarien geeignet und daher unflexibel seien.

“Wenn es uns gelingt, ähnliche Verfahren auf andere strukturierte Probleme anzuwenden, beispielsweise die Proteinfaltung, Energieeinsparungen oder die Suche nach revolutionären neuen Materialien, dann könnten die daraus resultierenden Durchbrüche das menschliche Verständnis voranbringen und unser alle Leben positiv beeinflussen”, schreibt Hassabis.

Da für das Lernverfahren keine menschlichen Daten benötigt wurden, könnte potenziell auch das Problem gelöst werden, dass Datensätze fürs maschinelle Lernen mit menschlichen Vorurteilen belastet sind. Das vollständige Paper ist hier einsehbar.

| Featured Image: Deepmind (Screenshot bei YouTube)

Empfohlene Artikel: