Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Co mě to přivádí k myšlence, je lidský zrak.
Je snadné zapomenout, a většina z nás se to nikdy nenaučila, že ani lidský zrak nemá ve skutečnosti velké pokrytí.
Máme velmi úzký, vysoce věrný reflektor, obklopený širokou periferií s nízkou věrností.
Důvodem, proč se nám naše vize zdá mnohem "úplnější", je to, že data, která dostává náš přední mozek, jsou ve skutečnosti výsledkem spousty následného zpracování v jiných oblastech mozku.
Jednou, když jsem pomáhal doktorandce percepční psychologie s kódem v C++ pro její diplomovou práci, jsem náhodou objevil, jak vymazat části tohoto postprocesního modelu.
To vytváří efekt, kdy můžete něco ukázat, podnět, oku, ale učinit to neviditelným pro mozek.
Byl to jeden z nejpodivnějších pocitů, jaké jsem kdy cítil. Nejprve jsem si myslel, že jsem zavedl chybu a kód, který prezentoval vizuální testovací podnět, již neběžel, protože jsem ho nemohl vidět.
Ale když jsem procházel s debuggerem, podnět tam byl. Bylo to prostě vymazáno z mé vizuální kůry dříve, než to moje vědomá mysl vůbec "viděla".
Doktorandka se na to podívala, pokrčila rameny, zvědavým tónem hlasu řekla "divné" a vrátila se k tématu své studie. A dostal jsem ick a zrušil své plány pozvat ji na rande.
Každopádně to zmiňuji, protože mě to podezřívá, že hardwarový přístup "panoptikonu" byl v praxi vždy odsouzen k zániku, pokud ani příroda nedělá věci tímto způsobem a místo toho nahrazuje detailní surový vstup náročným postprocesingem.
Domnívám se, že stejně jako v naší biologické evoluci, i vývoj našich počítačových systémů dosáhne bodu, kdy budou další výpočetní prostředky mnohem levnější než lepší periferie.
I když mi možná John řekne, že se to stalo před lety a já jsem tomu jen nevěnoval pozornost.

13. 8. 00:15
Byla vytvořena spousta bláznivých multikamerových rigů za účelem zachycení plně prostorového videa.
Vzpomínám si na rozhovor na Metě, který v podstatě zněl "než se podíváme na algoritmy strojového učení, budeme se co nejvíce opírat o klasické geometrické počítačové vidění", a já jsem tento směr podporoval. To bylo před mnoha lety, kdy vám ML stále připadalo jako nepředvídatelná alchymie, a vy samozřejmě chcete maximalizovat využití základní pravdy!
Tvrdé inženýrské úsilí bylo vynaloženo na kalibraci, synchronizaci a zpracování dat kamer, ale nikdy to skutečně nepřineslo výsledky. Bez ohledu na to, kolik kamer máte, jakýkoli složitý pohybující se objekt bude mít zakryté oblasti a "díry v realitě" ostře vyniknou pro diváka, který není přesně v jednom z bodů kamery.
I když máte dobrou viditelnost, nejednoznačnost ve vícekamerové fotogrammetrii činí věci méně přesnými, než byste chtěli. Proběhlo také několik experimentů, které měly zjistit, jak dobře lze provést rekonstrukci 3D scény z kamer Quest pomocí offline výpočtů, a odpověď byla stále "ne moc dobrá", s poměrně hrudkovitými povrchy. Spousta 3D rekonstrukcí vypadá úžasně při posouvání ve zdroji na vašem telefonu, ale ne tak dobře zvětšená do plně pohlcujícího VR vykreslování a postavená do kontrastu s vysoce kvalitní tradiční fotografií.
Opravdu potřebujete silné apriory, abyste řídili problém s montáží a vyplnili mezery v pokrytí. U architektonických scén můžete získat určité kilometry z jednoduchých rovinných apriorů, ale moderní generativní umělá inteligence je tím nejdůležitějším.
I kdyby bláznivé kamerové soupravy plně splnily slib, stále by neumožnily dobrý ekosystém obsahu. YouTube by neuspěl, kdyby každý tvůrce potřeboval kameru RED Digital Cinema.
(Docela dobré!) generování stereoskopických 3D fotografií v Quest Instagram je malým krokem do budoucnosti. Jsou cesty ke stereo videu a 6DOF statickému, případně k 6DOF videu.
Udělejte vše pohlcujícím a poté umožněte zakázkové ladění médií s pohlcujícím vědomím.

11,59K
Top
Hodnocení
Oblíbené