Eine Braut ist nicht wie die andere.

Große Bilddatenbanken wie ImageNet, Open Images und Conceptual Captions tragen zusammen mit der wachsenden Rechenleistung von Computern wesentlich dazu bei, dass Künstliche Intelligenz immer mächtiger wird.

Das Problem: Die Bilder in den bekanntesten Datensätzen sind auf die USA und den Westen zentriert. Algorithmen, die mit diesen Bildern trainiert werden, versagen mitunter, wenn sie Inhalte auf Bildern anderer Kulturkreise identifizieren sollen.

Google Brain verdeutlicht das anhand einer Aufnahme einer Braut: Im Westen trägt sie typisch ein weißes Kleid, in Indien hingegen einen Sari.

Ein mit dem Open-Image-Datensatz trainierter Bildanalyse-Algorithmus erkennt in diesem Szenario nur die westliche Braut als eben solche.

Vier Bräute, nur drei werden erkannt. Bild: Google

Vier Bräute, nur drei werden erkannt. Bild: Google

Bessere Algorithmen statt mehr Bilder

Nun sollte die Lösung für dieses Problem gerade einem riesigen Datenkonzern wie Google doch leichtfallen, sollte man meinen: Alles, was es braucht, ist ein repräsentativer Datensatz mit Bildern aus aller Welt zu allen erdenklichen Menschen, Objekten und Szenarien. Google könnte einfach sämtliche Bilddatenbanken aufkaufen oder Fotos erstellen und beschriften lassen.

Der Gedanke ist nicht falsch: Google baut an so einem Datensatz.

Aber der Konzern weiß auch: Egal, wie groß der Datensatz sein wird, er wird immer Unwuchten enthalten. Hinzu kommt, dass sich Kultur verändert. Ein möglichst repräsentativer Datensatz würde also nur die Symptome behandeln, statt die Ursachen zu beseitigen.

Viel mächtiger wären Algorithmen, die den Unterschied zwischen den Kulturen kennen und erkennen, die also wie Menschen generalisiert beurteilen, anstatt nur jeden einzelnen Pixel auf jedem einzelnen Bild zu analysieren.

Ein globaler Wettbewerb soll Fortschritte bringen

Aus diesem Grund rief Google im September den “Inclusive Images Competition” aus. Die Aufgabe der Wettbewerber: Das Vorurteil in Algorithmen reduzieren, die mit kulturell einseitigen Datensätzen trainiert wurden.

Über 100 Teilnehmer testeten ihre Algorithmen bei Googles KI-Benchmark-Plattform Kaggle an von Google vorgegebenen Bilddatenbanken mit Fotos aus sonst unterrepräsentierten Kulturkreisen.

Die Bildverteilung im Open-Image-Datensatz im Vergleich zu den Datensätzen des Wettbewerbs. Bild: Google

Die Bildverteilung im Open-Image-Datensatz im Vergleich zu den Datensätzen des Wettbewerbs. Bild: Google

Auf einer Fachkonferenz (via Venturebeat) bewertete Google-Brain-Forscher Pallavi Baljekar jetzt erstmals die bisherigen Resultate. Er spricht von kleinen Schritten hin zu vorurteilsfreien KI-Systemen: Die besten fünf Algorithmen erkannten die indische Braut als Person. Von einem Algorithmus wurde sie korrekt als Braut klassifiziert.

Weiterlesen über KI-Vorurteile:


Tagesaktuelle und redaktionell ausgewählte Tech- und VR-Deals: Zur Übersicht
VRODO-Podcast #120: Cebit-Erinnerungen, Duplex-Menschen und KI-Vorurteile | Alle Podcast-Folgen


Unsere Artikel enthalten vereinzelt sogenannte Affiliate-Links. Bei einem Kauf über einen dieser Links erhalten wir eine kleine Provision. Der Kaufpreis bleibt gleich.