Titelbild: Samasource

Ein kalifornisches Unternehmen lässt Trainingsdaten für Künstliche Intelligenz in einem Slum in Kenia vorbereiten.

Künstliche Intelligenz braucht Daten. Häufig müssen diese Daten vor der maschinellen Verwertung händisch aufbereitet werden.

Eine KI, die Autos erkennen soll, muss beispielsweise mit Tausenden Bildern trainiert werden, auf denen ein Auto zu sehen ist. Zusätzlich muss das Bild mit dem Wort „Auto“ beschriftet sein. Nur so kann eine Künstliche Intelligenz die Verbindung zwischen Bild und Wort herstellen. Je größer der Datensatz, desto effektiver ist das Training.

Die notwendigen Unterscheidungen zwischen verschiedenen Vehikeln und Menschen muss eine Auto-KI erst lernen. Dafür braucht sie menschliche Hilfe. Bild: Samasource

Diese mühsame Vorbereitung riesiger Datensätze fällt in nahezu allen KI-Projekten an. Die KI-Maschine, die die Menschheit eigentlich von repetitiven Aufgaben befreien soll, kann sie (noch) nicht selbst erledigen. Das könnte sie nur, wenn sie schon trainiert wäre. Dafür bräuchte sie wiederum Daten. Eine Sackgasse.

Bilder vorbereiten für neun Dollar pro Tag

Der Dienstleister Samasource aus San Francisco nimmt seinen Kunden die mühsame Datenvorbereitung ab. Zum Kundenkreis gehören unter anderem Google und Microsoft.

Samasource wurde bereits 2008 von Hauptgeschäftsführerin Leila Janah gegründet. Ihre Idee: die mühselige und teure Arbeit in Entwicklungsländer outsourcen.

„Sehr kluge Leute der Techbranche und große Philanthropen sagten, dass das Outsourcing eine wunderbare Idee sei, aber dass es nie funktionieren würde“, sagt Janah. Techunternehmen hätten Bedenken gehabt, dass die Menschen in Entwicklungsländern nicht über das notwendige IT-Wissen verfügten, um qualitative Standards einzuhalten.

Heute führt Janah die größte Datenvorbereiter-Firma in Ostafrika. Samasource hat außerdem Standorte in Asien und Nordamerika.

Gründerin Leilah Janah (zweite von links hinten, stehend) im Samasource Datencenter in Nairobi, Kenia. Bild: Samasource

In Nairobi arbeiten über 1.000 Menschen für Samasource, etwa drei Viertel stammen aus den umliegenden Slums, mehr als die Hälfte sind Frauen. Samasource bildet die Datenvorbereiter vor Ort in einer eigenen Schule aus.

Samasource bildet in eigenen Schulungszentren aus. Für viele Angestellte ist die Arbeit am Computer ungewohnt, da Smartphones und Tablets weiter verbreitet sind. Bild: Samasource

Samasource zahlt den Datenvorbereitern etwa neun US-Dollar pro Tag. Damit gehören sie zu den Besserverdienern in ihrer Gegend. Viele Bewohner des Slums erhalten oft nur zwei US-Dollar am Tag und das bei mitunter schlechteren oder gar gefährlichen Arbeitsbedingungen.

Auf Kritik an der im Vergleich zu den Gewinnen der Auftraggeber geringen Löhne reagiert Samasource mit Verweis auf die ökonomische Balance im Slum: Höhere Löhne würden das lokale finanzielle Gleichgewicht durcheinanderbringen und so mehr Schaden anrichten, als Nutzen stiften.

KI-Training ohne Daten ist in Entwicklung

Doch wie lange werden die Datenvorbereiter noch gebraucht? Längst wird an Algorithmen geforscht, die mit wenig oder gar ohne vorbereitete Daten auskommen oder die Daten eigenständig vorbereiten.

„Das ist die Milliarden-Dollar-Frage“, sagt Janah. „Ich denke, da gibt es eine Menge Hype. Aber wenn man tatsächlich mit Datenwissenschaftlern spricht, wird man feststellen, dass die Maschine viel weiter zurückliegt, als die meisten Leute glauben.“

Janah ist überzeugt: „Menschen werden noch für lange Zeit Trainingsdaten für Künstliche Intelligenz vorbereiten müssen.“

Via: BBC


Tagesaktuelle und redaktionell ausgewählte Tech- und VR-Deals: Zur Übersicht
VRODO-Podcast #120: Cebit-Erinnerungen, Duplex-Menschen und KI-Vorurteile | Alle Podcast-Folgen


Unsere Artikel enthalten vereinzelt sogenannte Affiliate-Links. Bei einem Kauf über einen dieser Links erhalten wir eine kleine Provision. Der Kaufpreis bleibt gleich.