0

3D-Scanning: Wie Skype für Virtual Reality

von Matthias Bastian9. November 2015

Christophe Leske ist Software-Entwickler und VR-Enthusiast bei multimedial. Eines seiner Projekte: In der virtuellen Realität soll es in Zukunft menschlicher zu gehen. Dafür experimentiert er mit der Sensorkamera Kinect, um Personen mittels 3D-Scan authentisch in Virtual Reality zu übertragen. Wir haben mit Christophe über das Potenzial der Technologie gesprochen und welche Hürden es noch zu überwinden gilt.

VRODO: Christophe, du beschäftigst dich sehr intensiv mit 3D-Scans, unter anderem arbeitest du mit der Sensorkamera Kinect von Microsoft. Was kann man mit der Technologie alles anstellen?

Christophe Leske: Jede Menge. Man kann beispielsweise einzelne Menschen wie vor einem Greenscreen aufnehmen und diese dann in virtuelle Umgebungen setzen. Das eignet sich zum Beispiel für virtuelle Produktpräsentationen – das ist auch ein Showcase, an dem ich arbeite. Wir beschäftigen uns aber auch mit Streaming. Fernziel ist eine Art Skype für Virtual Reality, wo man sich in einem virtuellen Raum trifft, beispielsweise für Besprechungen.

VRODO: Es ist erwiesen, dass Telefon- oder Videokonferenzen zu anderen Entscheidungen führen können wie Meetings, bei denen sich Menschen real begegnen. Mit Virtual Reality wäre dieser Effekt ja eigentlich beseitigt.

Leske: Theoretisch ja, man begegnet seinem Gegenüber real, nur eben in einem virtuellen Raum. Aber das Gefühl von Präsenz ist vorhanden. Das größte Hindernis aktuell sind wohl die klobigen VR-Brillen, die man dafür noch tragen muss. Die erleichtern die soziale Interaktion nicht unbedingt, weil die Brillen so groß sind, dass sie die komplette Mimik der Augenpartie verdecken. Dafür müssen die Hardware-Ingenieure noch Lösungen finden, was aber sicherlich über kurz oder lang der Fall sein wird. Unser Ziel ist es, reale Menschen in eine virtuelle Umgebung zu bringen. Ich denke, Virtual Reality braucht noch mehr Menschen und mehr humane Interaktion. Sei es als fertig aufgenommene “Hologramme” oder als direkt eingespeiste, live zugespielte Berater oder Moderatoren. Das kommt noch zu kurz.

Unser Ziel ist es, reale Menschen in eine virtuelle Umgebung zu bringen. Christophe Leske, multimedial

VRODO: Was sind die aktuell größten technologischen Hürden, die man für solche virtuellen Konferenzen überwinden müsste?

Leske: Das größte Problem ist, dass die enorme Datenmenge auf ein streambares Niveau gedrückt werden muss. Es fallen unkomprimiert pro Sekunde fast 100 Megabyte an Daten an, die gilt es auf knapp zwei bis drei Megabit pro Sekunde zu drücken (~300 Kb). Das ist echt wenig, und natürlich nur mit entsprechenden Qualitätsverlusten möglich. Ein weiteres Problem ist die damit verbundene Prozessorlast. Wir arbeiten mit zwei unterschiedlichen Codecs, einem für die 3D-Punkte und einem für das Videobild. Normale Videocodecs verarbeiten die 3D-Daten eher schlecht, weil Sie mit 8-Bit-Farbkanälen arbeiten, wir aber 16-Bit-Werte für die Tiefendaten der Kinect benötigen. Außerdem mussten wir eine Lösung finden dekodierte Daten auch fehlerfrei darzustellen, also beispielsweise ohne Artefakte. Wir unterstützten daher zwei verschiedene Render-Technologien: einmal Punkt-Rendering (Punktwolken-Darstellung) und einmal richtige 3D-Meshes. Beide haben Ihre Vor- und Nachteile. Punkt-Rendering ist sehr interessant, da es schärfer ist und fehlende Renderpunkte kompensiert werden können.

3D-Scan von Christophe Leske

Live-3D-Scan – theoretisch könnte man sich auch in einer VR-Umgebung treffen. Quelle: Christophe Leske

VRODO: Ist die Vorstellung, dass wir uns in virtuellen Konferenzräumen treffen, noch reine Zukunftsmusik?

Leske: Es gibt einige große Unternehmen wie Intel und Google, die sich dem Thema 3D-Scanning verschrieben haben. Auch kommen immer mehr 3D-Sensoren auf den Markt und eine Unmenge an 3D-Kameras, die auch schon günstig genug zu haben sind für den Otto-Normalverbraucher. Ich glaube, soweit ist diese Zukunft gar nicht mehr entfernt.