Es wurden viele verrückte Kamerarigs entwickelt, um vollständige räumliche Videos aufzunehmen. Ich erinnere mich an ein Gespräch bei Meta, das im Grunde genommen lautete: „Wir werden so stark wie möglich auf klassische geometrische Computer Vision setzen, bevor wir uns maschinellen Lernalgorithmen zuwenden“, und ich war dieser Richtung gegenüber aufgeschlossen. Das war vor vielen Jahren, als ML sich noch wie unberechenbare Alchemie anfühlte, und natürlich möchte man die Nutzung der Grundwahrheit maximieren! Es wurde viel harte Ingenieursarbeit in die Kamerakalibrierung, Synchronisation und Datenverarbeitung gesteckt, aber es hat nie wirklich die Vision erfüllt. Egal wie viele Kameras man hat, jedes komplexe bewegte Objekt wird verdeckte Bereiche haben, und „Löcher in der Realität“ fallen einem Betrachter, der sich nicht genau an einem der Kamerapunkte befindet, stark auf. Selbst wenn man gute Sicht hat, machen die Mehrkamera-Photogrammetrie die Dinge weniger präzise, als man es sich wünschen würde. Es gab auch einige Experimente, um zu sehen, wie gut man die 3D-Szenenrekonstruktion von den Quest-Kameras mit Offline-Computing machen kann, und die Antwort war immer noch „nicht sehr gut“, mit ziemlich klumpigen Oberflächen. Viele 3D-Rekonstruktionen sehen großartig aus, wenn sie im Feed auf deinem Telefon vorbeiscrollen, aber nicht so gut, wenn sie für eine vollständig immersive VR-Darstellung vergrößert werden und im Vergleich zu einem hochwertigen traditionellen Foto stehen. Man braucht wirklich starke Prämissen, um das Anpassungsproblem zu steuern und Deckungslücken zu schließen. Für architektonische Szenen kann man mit einfachen planaren Prämissen etwas erreichen, aber moderne generative KI ist die ultimative Prämisse. Selbst wenn die verrückten Kamerarigs das Versprechen vollständig eingelöst hätten, hätten sie immer noch kein gutes Inhaltsökosystem ermöglicht. YouTube hätte nicht Erfolg gehabt, wenn jeder Creator eine RED Digital Cinema Kamera benötigt hätte. Die (ziemlich gute!) stereoskopische 3D-Fotogenerierung in Quest Instagram ist ein erster Schritt in Richtung Zukunft. Es gibt Wege zu Stereo-Video und 6DOF-Statisch, und schließlich zu 6DOF-Video. Mach alles immersiv und ermögliche dann eine maßgeschneiderte Anpassung von immersivem Medien.
160,92K