Byla vytvořena spousta bláznivých multikamerových rigů za účelem zachycení plně prostorového videa.  Vzpomínám si na rozhovor na Metě, který v podstatě zněl "než se podíváme na algoritmy strojového učení, budeme se co nejvíce opírat o klasické geometrické počítačové vidění", a já jsem tento směr podporoval. To bylo před mnoha lety, kdy vám ML stále připadalo jako nepředvídatelná alchymie, a vy samozřejmě chcete maximalizovat využití základní pravdy! Tvrdé inženýrské úsilí bylo vynaloženo na kalibraci, synchronizaci a zpracování dat kamer, ale nikdy to skutečně nepřineslo výsledky. Bez ohledu na to, kolik kamer máte, jakýkoli složitý pohybující se objekt bude mít zakryté oblasti a "díry v realitě" ostře vyniknou pro diváka, který není přesně v jednom z bodů kamery. I když máte dobrou viditelnost, nejednoznačnost ve vícekamerové fotogrammetrii činí věci méně přesnými, než byste chtěli. Proběhlo také několik experimentů, které měly zjistit, jak dobře lze provést rekonstrukci 3D scény z kamer Quest pomocí offline výpočtů, a odpověď byla stále "ne moc dobrá", s poměrně hrudkovitými povrchy. Spousta 3D rekonstrukcí vypadá úžasně při posouvání ve zdroji na vašem telefonu, ale ne tak dobře zvětšená do plně pohlcujícího VR vykreslování a postavená do kontrastu s vysoce kvalitní tradiční fotografií. Opravdu potřebujete silné apriory, abyste řídili problém s montáží a vyplnili mezery v pokrytí. U architektonických scén můžete získat určité kilometry z jednoduchých rovinných apriorů, ale moderní generativní umělá inteligence je tím nejdůležitějším. I kdyby bláznivé kamerové soupravy plně splnily slib, stále by neumožnily dobrý ekosystém obsahu. YouTube by neuspěl, kdyby každý tvůrce potřeboval kameru RED Digital Cinema. (Docela dobré!) generování stereoskopických 3D fotografií v Quest Instagram je malým krokem do budoucnosti. Jsou cesty ke stereo videu a 6DOF statickému, případně k 6DOF videu. Udělejte vše pohlcujícím a poté umožněte zakázkové ladění médií s pohlcujícím vědomím.
147,95K