26.06.2020

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

Mit "Immersive Light Field Video" schafft Google eine neue Form von 3D-Video, in dem man - bis zu einem gewissen Grad - die Perspektive wechseln und "um die Ecke schauen" kann.
/artikel/google-3d-video-immersive-light-field
Google: So sieht der
(c) Google: So sieht der "Capture Rig" aus - 46 Kameras für eine neue Form von 3D-Video

Mit „Immersive Light Field Video with a Layered Mesh Representation“ trägt das Projekt derzeit noch einen recht sperrigen Namen, der vor einer kommerziellen Nutzung wohl nochmal überdacht werden muss. Doch was Google-Mitarbeiter unter diesem Titel kreiert haben, ist durchaus beeindruckend. Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein. In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“. Mit bisherigen 3D- oder auch 360-Grad-Video-Lösungen waren Nutzer immer auf einen Beobachtungspunkt fixiert.

Hardware-Seite als kleinere Herausforderung

Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung. Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video (siehe unten). Sogar Gegenstände in nur 20 Zentimeter Entfernung können erfasst werden.

+++ Mehr News zum Thema Artificial Intelligence +++

Es ist vor allem die Software, die neue Maßstäbe setzt. In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle. Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

Erklär-Video zu „Immersive Light Field Video with a Layered Mesh Representation“

Unterschied zu bisherigen 3D-Video-Formaten

Dadurch meinen die Projekt-Mitarbeiter auch, einen bedeutenden Fortschritt im Vergleich zu ähnlichen Versuchen der vergangenen zwei Jahrzehnte erreicht zu haben. Während die derzeit gängigen 3D-Video-Formate für VR-Anwendungen durch die statische Perspektive bei vielen Usern zu Übelkeit führen würden, gebe es bei den bisherigen multiperspektivischen Ansätzen stets hohe Hardware-Kosten bei der Erstellung und -Anforderungen bei der Verarbeitung.

⇒ Blog-Beitrag

⇒ Whitepaper

Redaktionstipps
Deine ungelesenen Artikel:
vor 9 Stunden

Wie ein Popstar: Peter Steinberger und sein VivaTech-Moment zwischen Bezos und Modi

Am zweiten Tag der VivaTech, Europas größtem Tech-Event im Paris Convention Center bei der Porte de Versailles, drängt sich das Who-is-Who der Branche über drei Stockwerke. Mittendrin, gefeiert wie ein Popstar: der Österreicher Peter Steinberger. Eine Reportage über Fans in OpenClaw-Shirts, einen leisen Bühnenauftritt und die Frage, die über der ganzen Messe schwebt.
/artikel/wie-ein-popstar-peter-steinberger-und-sein-vivatech-moment-zwischen-bezos-und-modi
vor 9 Stunden

Wie ein Popstar: Peter Steinberger und sein VivaTech-Moment zwischen Bezos und Modi

Am zweiten Tag der VivaTech, Europas größtem Tech-Event im Paris Convention Center bei der Porte de Versailles, drängt sich das Who-is-Who der Branche über drei Stockwerke. Mittendrin, gefeiert wie ein Popstar: der Österreicher Peter Steinberger. Eine Reportage über Fans in OpenClaw-Shirts, einen leisen Bühnenauftritt und die Frage, die über der ganzen Messe schwebt.
/artikel/wie-ein-popstar-peter-steinberger-und-sein-vivatech-moment-zwischen-bezos-und-modi
Peter Steinberger auf der Bühne des VivaTech Theater in Paris | Foto: Martin Pacher

Es ist der zweite Tag der VivaTech und Paris führt der Tech-Welt vor, wie groß ein Heimspiel sein kann. Seit 2016 lädt die Messe, gegründet von Publicis-Veteran Maurice Lévy und der Les-Echos-Gruppe, einmal im Jahr an die Porte de Versailles. Zur zehnten, der Jubiläumsausgabe, ist sie noch eine Spur größer: Europas wichtigstes Startup- und Tech-Event erwartet rund 180.000 Besucher:innen, 15.000 Startups, 4.000 Investor:innen und mehr als 450 Speaker:innen auf vier Bühnen. Das Leitthema klingt programmatisch: „Artificial Intelligence: impact, not illusion.“ Deutschland ist „Country of the Year“ und schickt die größte Delegation der VivaTech-Geschichte.

Über drei Stockwerke der neuen Halle 7 verteilt sich das Who-is-Who der Branche. Tags zuvor füllte Amazon- und Blue-Origin-Gründer Jeff Bezos, inzwischen auch Co-CEO der KI-Industrieschmiede Prometheus, das große VivaTech Theater. An diesem Donnerstag teilen sich Frankreichs Präsident Emmanuel Macron und Indiens Premierminister Narendra Modi die politische Bühne, Modi frisch vom G7-Gipfel im französischen Evian, wo er mit Donald Trump unter anderem über Künstliche Intelligenz beraten hatte. Dazwischen Konzernlenker:innen von LVMH bis Alibaba, EU-Kommissarin Henna Virkkunen und Deutschlands Digitalminister Karsten Wildberger.

Ein Österreicher unter den „Top Voices“

Wer auf die Website der VivaTech schaut, findet ihn unter den „Top Voices“: Gleich neben Jeff Bezos ist dort Peter Steinberger gelistet. Zwischen all den globalen Namen sticht der gebürtige Oberösterreicher ins Auge. In der Entwickler:innen-Szene seit Jahren als „steipete“ bekannt, hat er mit dem viralen Open-Source-Agenten OpenClaw internationale Bekanntheit erlangt und wird hier auf der VivaTech wie ein Popstar gefeiert. Vom Wiener Startup PSPDFKit, das er mehr als ein Jahrzehnt aufgebaut hatte, ist er längst weitergezogen: Seit Februar gehört er bei OpenAI zum Team rund um den Coding-Agenten Codex.

Peter Steinberger (links) und OpenAI-Manager Thibault Sottiaux beim Panel „The Agentic Enterprise“ auf der VivaTech 2026 in Paris | Foto(c) Martin Pacher | brutkasten

Sein Panel findet im VivaTech Theater statt, dem größten Saal des Geländes. Wer einen Platz will, muss sich lange anstellen. Unter den Wartenden auch Fans, die in OpenClaw-Shirts extra aus Wien angereist sind, um ihr Idol zu sehen.

„Das ist nicht spezifisch fürs Coding“

Auf der Bühne dann ein Mann, der so gar nicht nach Rummel klingt. Steinberger spricht ruhig, zurückhaltend, bescheiden. Neben der technologischen Souveränität ist Agentic AI eines der großen Themen dieser Jubiläumsausgabe, und genau darum dreht sich sein Panel „The Agentic Enterprise: From Software Development to Everyday Work“, gemeinsam mit Thibault Sottiaux, der bei OpenAI Produkt und Plattform verantwortet.

Sottiaux‘ Kernthese: Was einen Coding-Agenten gut mache, sei nicht das Programmieren selbst, sondern die Fähigkeit, breiten Kontext zu erfassen und über lange Zeit präzise auf ein Ziel hinzuarbeiten. „Das ist nicht spezifisch fürs Coding“, sagt er. So solle aus dem Entwickler:innen-Werkzeug Codex ein Agent für Finanz-, Marketing- und Büroarbeit werden. Die Nutzung wachse nach seinen Worten derzeit schneller in Europa als in den USA.

Volles Haus: Peter Steinberger und Thibault Sottiaux (OpenAI) auf dem VivaTech Theater, der größten Bühne der Messe. Hier hatten zuvor auch Jeff Bezos und später Indiens Premierminister Narendra Modi gesprochen, der Saal war bis zum letzten Platz gefüllt | (c) Martin Pacher / brutkasten

Ein Agent für das Haus in Wien

Dann ist Steinberger an der Reihe, und er macht das Abstrakte greifbar, indem er von sich selbst erzählt. Er trenne bewusst mehrere Agenten-Kontexte: einen privaten, der alles über ihn wisse, einen für sein Haus in Wien, mit dem er etwa die Kameras kontrolliere und „manchmal meiner Putzfrau einen Streich spiele“, und einen für die Arbeit. Mit der heutigen Technik liefere ein spezialisierter Agent noch deutlich bessere und vorhersehbarere Ergebnisse als ein einzelner Alleskönner. Je mehr Kontext man dem Modell gebe, desto verlässlicher werde es.

„Das größte Hindernis ist die Vorstellungskraft“

Das größte Hindernis sei ohnehin nicht die Technik, sondern die Vorstellungskraft, „imagination“, wie er sagt. Die Lücke zwischen dem, was die Modelle könnten, und dem, was Menschen tatsächlich mit ihnen anstellten, sei so groß wie nie. Selbst ein Werkzeug wie OpenClaw hätte Monate früher entstehen können, sei aber schlicht niemandem eingefallen. Er verweist auf seinen eigenen, anfangs belächelten Blogpost vom Jahresende, in dem er beschrieb, Code zu schreiben, ohne ihn überhaupt zu lesen. Für das Jahr 2030 entwirft er daraus ein radikales Bild: eine Milliarde Programmierer:innen, die nicht wüssten, dass sie programmieren, weil sie ihre Agenten nur noch um Lösungen bäten.

Peter Steinberger unter seinen Fans bei der VivaTech 2026 in Paris. Fotos: brutkasten / Martin Pacher

Die Europa-Pointe zum Schluss

Und dann, fast beiläufig, die Pointe, die über der ganzen Messe schwebt. Auf Europa angesprochen, sagt ausgerechnet jener Mann, der zuletzt mit Verweis auf zu viel Regulierung in die USA gezogen ist, er liebe es, „dass wir Mistral haben“. In europäischen Startups stecke etwas „zutiefst Menschliches“, sie seien „in etwas Realem verwurzelt“. Als die Moderatorin fragt, ob er eines Tages zurückkehre, weicht Steinberger aus: „Vielleicht. Ich bin ohnehin ständig hier.“

Am Ende steigt er von der Bühne und wird sofort von Fans umzingelt, die Handys gezückt, Selfie um Selfie, bis das Sicherheitspersonal dazwischengeht. Peter lächelt und lässt den Rummel um seine Person über sich ergehen. Hinaus geht es schließlich über einen Seitenausgang.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.

brutkasten Newsletter

Aktuelle Nachrichten zu Startups, den neuesten Innovationen und politischen Entscheidungen zur Digitalisierung direkt in dein Postfach. Wähle aus unserer breiten Palette an Newslettern den passenden für dich.

Montag, Mittwoch und Freitag

AI Summaries

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Welche gesellschaftspolitischen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Welche wirtschaftlichen Auswirkungen hat der Inhalt dieses Artikels?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Innovationsmanager:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Investor:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Welche Relevanz hat der Inhalt dieses Artikels für mich als Politiker:in?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Was könnte das Bigger Picture von den Inhalten dieses Artikels sein?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Wer sind die relevantesten Personen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.

AI Kontextualisierung

Wer sind die relevantesten Organisationen in diesem Artikel?

Leider hat die AI für diese Frage in diesem Artikel keine Antwort …

Google bringt mit einem 46-Kamera-Koloss 3D-Video auf ein neues Level

  • Ein kolossaler „Capture Rig“, in dem 46 Kameras verbaut sind, fängt das Grundmaterial für ein neues Level von 3D-Video ein.
  • In diesem können User – bevorzugt mit VR-Brille – bis zu einem gewissen Grad die Perspektive wechseln und so sogar „um die Ecke schauen“.
  • Die Hardware-Seite ist dabei dem Vernehmen nach die kleinere Herausforderung: Der „Capture Rig“ bestehend aus 46 üblichen Sport-Kameras mit je rund 18 Zentimeter Abstand, einer Plexiglas-Halbkugel, einem Gestell und einem Stativ sei „günstig und relativ leicht herzustellen“, meinen die Entwickler in einem Erklär-Video.
  • Es ist vor allem die Software, die neue Maßstäbe setzt: In einer Reihe von Schritten errechnet der genutzte Algorithmus auf Basis der Google DeepView-AI-Technologie unter anderem die Entfernungen der erfassten Gegenstände und erstellt 3D-Modelle.
  • Am Ende komme aber eine „leichtgewichtiges“ Format heraus, das sich auch in mobilen VR/AR-Plattformen, oder im Web-Browser rendern lasse, so die Entwickler in ihrem Whitepaper.