Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ceea ce mă face să mă gândesc este viziunea umană.
Este ușor să uităm, și cei mai mulți dintre noi nici măcar nu am învățat, că nici viziunea umană nu are o acoperire prea mare.
Avem un reflector foarte îngust, de înaltă fidelitate, înconjurat de o periferie largă, de mică fidelitate.
Motivul pentru care vederea noastră pare mult mai "completă" este că datele pe care le primește creierul nostru anterior sunt de fapt rezultatul multor post-procesări în alte zone ale creierului.
Odată, în timp ce ajutam o doctorandă în psihologie perceptuală cu un cod C++ pentru cercetarea tezei, am descoperit din greșeală cum să șterg părți din acest model post-procesat.
Acest lucru creează un efect în care poți arăta ceva, un stimul, ochiului, dar îl faci invizibil pentru creier.
A fost una dintre cele mai ciudate senzații pe care le-am simțit vreodată. La început, am crezut că am introdus o eroare, iar codul care prezenta stimulul testului vizual nu mai rula, pentru că nu-l puteam vedea.
Dar când am trecut cu un depanator, stimulul a fost acolo. Pur și simplu a fost șters din cortexul meu vizual înainte ca mintea mea conștientă să-l "vadă".
Doctoranda s-a uitat la asta, a ridicat din umeri, a spus "ciudat" pe un ton necurios și s-a întors la subiectul studiului ei. Și am renunțat la planurile mele de a o invita la o întâlnire.
Oricum, aduc asta în discuție pentru că mă face să bănuiesc că abordarea hardware "panoptică" a fost întotdeauna sortită eșecului în practică, dacă nici măcar natura nu face lucrurile în acest fel, și în schimb înlocuiește post-procesarea grea cu intrarea brută detaliată.
Bănuiesc că, la fel ca în evoluția noastră biologică, evoluția sistemelor noastre informatice va atinge un punct în care calculul suplimentar este mult mai ieftin decât perifericele mai bune.
Deși poate că John este pe cale să-mi spună că asta s-a întâmplat cu ani în urmă și pur și simplu nu am fost atent.

13 aug., 00:15
Au existat o mulțime de platforme nebunești cu mai multe camere create cu scopul de a captura videoclipuri spațiale complete.
Îmi amintesc o conversație la Meta care a fost practic "ne vom baza cât mai mult posibil pe viziunea geometrică clasică pe computer înainte de a ne uita la algoritmii de învățare automată" și am susținut această direcție. Asta s-a întâmplat cu mulți ani în urmă, când ML încă se simțea ca o alchimie imprevizibilă și, desigur, vrei să-ți maximizezi utilizarea adevărului de bază!
Efortul de inginerie a fost folosit în calibrarea camerei, sincronizarea și procesarea datelor, dar nu a livrat niciodată cu adevărat viziunea. Indiferent de câte camere ai, orice obiect complex în mișcare va avea zone ocluzate, iar "găurile din realitate" ies în evidență pentru un privitor nu tocmai într-unul dintre punctele camerei.
Chiar și atunci când aveți o vizibilitate bună, ambiguitățile din fotogrammetria cu mai multe camere fac lucrurile mai puțin precise decât v-ați dori. Au existat și câteva experimente pentru a vedea cât de bine poți face reconstrucția scenei 3D de la camerele Quest folosind calculul offline, iar răspunsul a fost încă "nu foarte bun", cu suprafețe destul de aglomerate. O mulțime de reconstrucții 3D arată uimitor derulând în fluxul de pe telefon, dar nu atât de bine într-o redare VR complet imersivă și pusă în contrast cu o fotografie tradițională de înaltă calitate.
Aveți nevoie de priori puternici pentru a rezolva problema de montare și pentru a umple golurile de acoperire. Pentru scenele arhitecturale, puteți obține ceva kilometraj din priorii planari simpli, dar AI generativă modernă este priorul suprem.
Chiar dacă platformele nebunești de cameră și-ar fi îndeplinit pe deplin promisiunea, tot nu ar fi permis un ecosistem de conținut bun. YouTube nu ar fi reușit dacă fiecare creator ar fi avut nevoie de o cameră RED Digital Cinema.
Generarea de fotografii 3D stereoscopice (destul de bune!) din Quest Instagram este un pas mic spre viitor. Există căi către video stereo și static 6DOF, apoi în cele din urmă către video 6DOF.
Faceți totul captivant, apoi permiteți reglarea personalizată a mediilor captivive.

12,83K
Limită superioară
Clasament
Favorite