Dank moderner Bild-zu-Bild Übersetzung könnt ihr eine Katze ins Internet schmieren und eine Künstliche Intelligenz macht daraus ein realistisches Foto. Mehr oder weniger.

In den letzten Jahren hat die Bildgenerierung mittels Künstlicher Intelligenz große Fortschritte erzielt. Kürzlich veröffentlichte Googles KI-Schwester Deepmind ein neues Modell, das täuschend echte Fotos generiert, zum Beispiel von Tieren, Burgern oder Raketenstarts.

Alle Fotos sind von Deepmind generiert worden. Kein Detail ist echt. Bild: Deepmind

Die Bild-KIs können auch für die sogenannte Bild-zu-Bild-Übersetzung eingesetzt werden. Bei dieser wird ein Ausgangsbild, zum Beispiel eine Zeichnung eines Schuhs, in ein real wirkendes Foto umgewandelt. Das ist beispielsweise praktisch bei der schnellen Prototypentwicklung.

Die KI generiert aus der einfachen Zeichnung ein Foto. Fortschrittlichere Algorithmen können Farbe und Material frei ändern. Bild: affinelayer.com

KI vollendet eure Vorstellung

Dank Christopher Hesse könnt ihr die Technologie jetzt selbst im Browser ausprobieren: Bei „edges2cats“ malt ihr wenige Striche ins Internet. Eine Bild-KI wandelt diese in ein mehr oder weniger passables Katzenfoto um.

Die KI versucht, bekannte Formen zu erkennen und sie realistisch umzusetzen. Bild: affinelayer.com

Das Modell auf der Webseite wurde mit etwa 2.000 Katzenfotos trainiert. Hesse hat das Projekt bereits im Februar 2017 veröffentlicht, seitdem gab es einige Fortschritte. Erwartet also keine Ergebnisse mit der Qualität von Deepmind- oder Nvidia-Fakes.

Ihr könnt auf der Website auf dieselbe Art auch Häuserfassaden, Schuhe und Taschen generieren.

Hier sind verschiedene Objekte unterschiedlich gefärbt. Balkone sind grün, Türen blau. Im Baukastenprinzip könnt ihr so komplexe Fassaden erstellen. Bild: affinelayer.com

Überall Katzen!

Wirklich interessante Ergebnisse produziert der edges2cats-Algorithmus übrigens, wenn ihr der KI einfach mal ganz andere Formen als Input liefert und sie anschließend versuchen lasst, unbedingt eine Katze in dieser Form zu erkennen. Womöglich entsteht so ja wertvolle KI-Kunst.

Ist es ein Haus, ist es eine Katze, ist es Katzentoast? Bild: affinelayer.com

Hesse empfiehlt als Browser die Desktop-Version von Chrome. Die Webseite mit den Bildgeneratoren findet ihr hier.


Tagesaktuelle und redaktionell ausgewählte Tech- und VR-Deals: Zur Übersicht
VRODO-Podcast #120: Cebit-Erinnerungen, Duplex-Menschen und KI-Vorurteile | Alle Podcast-Folgen


Unsere Artikel enthalten vereinzelt sogenannte Affiliate-Links. Bei einem Kauf über einen dieser Links erhalten wir eine kleine Provision. Der Kaufpreis bleibt gleich.