Apa yang membuat saya berpikir adalah visi manusia. Sangat mudah untuk melupakan, dan kebanyakan dari kita bahkan tidak pernah belajar, bahwa penglihatan manusia juga tidak benar-benar memiliki cakupan yang bagus. Kami memiliki lampu sorot yang sangat sempit dan fidelitas tinggi, dikelilingi oleh pinggiran yang lebar dan fidelitas rendah. Alasan penglihatan kita terasa jauh lebih "lengkap" daripada itu bagi kita adalah bahwa data yang diperoleh otak depan kita sebenarnya adalah hasil dari banyak pasca-pemrosesan di area otak lainnya. Suatu kali, saat membantu seorang mahasiswa doktoral dalam psikologi persepsi dengan beberapa kode C ++ untuk penelitian tesisnya, saya secara tidak sengaja menemukan cara menghapus bagian dari model pasca-proses ini. Ini menciptakan efek di mana Anda dapat menunjukkan sesuatu, stimulus, ke mata, tetapi membuatnya tidak terlihat oleh otak. Itu adalah salah satu sensasi paling aneh yang pernah saya rasakan. Awalnya, saya pikir saya telah memperkenalkan bug, dan kode yang menyajikan stimulus tes visual tidak lagi berjalan, karena saya tidak dapat melihatnya. Tetapi ketika saya berjalan dengan debugger, stimulusnya ada di sana. Itu hanya dihapus dari korteks visual saya sebelum pikiran sadar saya pernah "melihatnya". Mahasiswa PhD melihat ini, mengangkat bahu, berkata "aneh" dengan nada suara yang tidak ingin tahu, dan kembali ke topik studinya. Dan saya mendapat ick dan membatalkan rencana saya untuk mengajaknya berkencan. Bagaimanapun, saya mengemukakan ini karena itu membuat saya curiga bahwa pendekatan perangkat keras "panopticon" selalu ditakdirkan dalam praktiknya, jika bahkan alam tidak melakukan hal-hal seperti itu, dan sebaliknya menggantikan pasca-pemrosesan yang berat untuk input mentah yang terperinci. Saya menduga bahwa, seperti dalam evolusi biologis kita, evolusi sistem komputer kita akan mencapai titik di mana komputasi tambahan jauh lebih murah daripada periferal yang lebih baik. Meskipun mungkin John akan memberi tahu saya bahwa ini terjadi bertahun-tahun yang lalu dan saya tidak memperhatikan.
John Carmack
John Carmack13 Agu, 00.15
Ada banyak rig kamera gila yang dibuat untuk tujuan menangkap video spasial penuh.  Saya ingat percakapan di Meta yang pada dasarnya "kita akan bersandar sekeras mungkin pada visi komputer geometris klasik sebelum melihat algoritme pembelajaran mesin", dan saya mendukung arah itu. Itu bertahun-tahun yang lalu, ketika ML masih terasa seperti alkimia yang tidak dapat diprediksi, dan tentu saja Anda ingin memaksimalkan penggunaan kebenaran dasar! Upaya rekayasa hardcore masuk ke kalibrasi kamera, sinkronisasi, dan pemrosesan data, tetapi tidak pernah benar-benar memenuhi visi. Tidak peduli berapa banyak kamera yang Anda miliki, setiap objek bergerak yang kompleks akan memiliki area tersumbat, dan "lubang dalam kenyataan" menonjol secara mencolok bagi pemirsa tidak persis di salah satu titik kamera. Bahkan ketika Anda memiliki visibilitas yang baik, ambiguitas dalam fotogrametri multi kamera membuat segalanya kurang presisi dari yang Anda inginkan. Ada juga beberapa eksperimen untuk melihat seberapa baik Anda dapat membuat rekonstruksi adegan 3D dari kamera Quest menggunakan komputasi offline, dan jawabannya masih "tidak terlalu bagus", dengan permukaan yang cukup menggumpal. Banyak rekonstruksi 3D terlihat luar biasa jika digulir di umpan di ponsel Anda, tetapi tidak begitu bagus diledakkan menjadi rendering VR yang sepenuhnya imersif dan diletakkan kontras dengan foto tradisional berkualitas tinggi. Anda benar-benar membutuhkan priori yang kuat untuk mendorong masalah pemasangan dan mengisi celah cakupan. Untuk adegan arsitektur, Anda bisa mendapatkan beberapa jarak tempuh dari planar sebelumnya sederhana, tetapi AI generatif modern adalah yang terdahulu. Bahkan jika rig kamera gila sepenuhnya memenuhi janji, mereka tetap tidak akan memungkinkan ekosistem konten yang baik. YouTube tidak akan berhasil jika setiap pembuat konten membutuhkan kamera RED Digital Cinema. Generasi foto 3D stereoskopik (cukup bagus!) di Quest Instagram adalah langkah kecil menuju masa depan. Ada jalur ke video stereo dan statis 6DOF, lalu akhirnya ke video 6DOF. Jadikan semuanya imersif, lalu izinkan penyetelan media sadar imersif yang dipesan lebih dahulu.
12,41K