Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Điều này khiến tôi nghĩ đến thị giác của con người.
Thật dễ để quên, và hầu hết chúng ta thậm chí chưa bao giờ học, rằng thị giác của con người thực sự không có độ bao phủ tốt.
Chúng ta có một vùng sáng hẹp, độ phân giải cao, được bao quanh bởi một vùng ngoại vi rộng, độ phân giải thấp.
Lý do mà thị giác của chúng ta cảm thấy "hoàn chỉnh" hơn nhiều so với thực tế là vì dữ liệu mà não trước của chúng ta nhận được thực sự là kết quả của rất nhiều quá trình xử lý sau ở các khu vực khác của não.
Một lần, trong khi giúp một sinh viên tiến sĩ về tâm lý học cảm nhận với một số mã C++ cho nghiên cứu luận án của cô ấy, tôi đã tình cờ phát hiện ra cách xóa các phần của mô hình đã được xử lý sau này.
Điều này tạo ra một hiệu ứng mà bạn có thể cho một cái gì đó, một kích thích, vào mắt, nhưng làm cho nó vô hình với não.
Đó là một trong những cảm giác kỳ lạ nhất mà tôi từng cảm nhận. Ban đầu, tôi nghĩ rằng tôi đã giới thiệu một lỗi, và mã mà trình bày kích thích thị giác không còn chạy nữa, vì tôi không thể thấy nó.
Nhưng khi tôi đi qua với một trình gỡ lỗi, kích thích vẫn ở đó. Nó chỉ đơn giản bị xóa khỏi vỏ não thị giác của tôi trước khi tâm trí ý thức của tôi "thấy" nó.
Sinh viên tiến sĩ nhìn vào điều này, nhún vai, nói "kỳ lạ" với giọng điệu không tò mò, và quay lại với chủ đề nghiên cứu của cô ấy. Và tôi cảm thấy không thoải mái và hủy bỏ kế hoạch mời cô ấy đi hẹn hò.
Dù sao, tôi đề cập đến điều này vì nó khiến tôi nghi ngờ rằng cách tiếp cận phần cứng "panopticon" luôn bị định sẵn để thất bại trong thực tế, nếu ngay cả tự nhiên cũng không làm theo cách đó, mà thay vào đó thay thế bằng việc xử lý sau nặng nề cho đầu vào thô chi tiết.
Tôi nghi ngờ rằng, giống như trong sự tiến hóa sinh học của chúng ta, sự tiến hóa của các hệ thống máy tính của chúng ta sẽ đạt đến một điểm mà việc tính toán thêm rẻ hơn nhiều so với các thiết bị ngoại vi tốt hơn.
Mặc dù có thể John sắp nói với tôi rằng điều này đã xảy ra từ nhiều năm trước và tôi chỉ không chú ý.

00:15 13 thg 8
Đã có rất nhiều thiết bị quay nhiều camera điên rồ được tạo ra với mục đích ghi lại video không gian đầy đủ.
Tôi nhớ một cuộc trò chuyện tại Meta mà cơ bản là "chúng tôi sẽ tập trung hết sức vào thị giác máy tính hình học cổ điển trước khi xem xét các thuật toán học máy", và tôi đã ủng hộ hướng đi đó. Đó là nhiều năm trước, khi ML vẫn cảm thấy như một loại giả kim thuật không thể đoán trước, và tất nhiên bạn muốn tối đa hóa việc sử dụng sự thật cơ bản!
Nỗ lực kỹ thuật cứng rắn đã được thực hiện để hiệu chỉnh camera, đồng bộ hóa và xử lý dữ liệu, nhưng nó chưa bao giờ thực sự mang lại tầm nhìn. Dù bạn có bao nhiêu camera, bất kỳ đối tượng di chuyển phức tạp nào cũng sẽ có những khu vực bị che khuất, và "lỗ hổng trong thực tế" nổi bật rõ ràng với một người xem không đứng ở một trong các điểm camera.
Ngay cả khi bạn có tầm nhìn tốt, những sự mơ hồ trong photogrammetry đa camera làm cho mọi thứ kém chính xác hơn bạn mong muốn. Cũng đã có một số thí nghiệm để xem bạn có thể làm tốt như thế nào trong việc tái tạo cảnh 3D từ các camera Quest bằng cách sử dụng tính toán ngoại tuyến, và câu trả lời vẫn là "không tốt lắm", với những bề mặt khá gồ ghề. Nhiều tái tạo 3D trông tuyệt vời khi cuộn qua trong nguồn cấp dữ liệu trên điện thoại của bạn, nhưng không tốt khi phóng to lên một bản render VR hoàn toàn sống động và so sánh với một bức ảnh truyền thống chất lượng cao.
Bạn thực sự cần những giả định mạnh mẽ để điều khiển vấn đề khớp và lấp đầy các khoảng trống. Đối với các cảnh kiến trúc, bạn có thể thu được một số lợi ích từ các giả định phẳng đơn giản, nhưng AI sinh tạo hiện đại là giả định tối ưu.
Ngay cả khi các thiết bị camera điên rồ hoàn toàn thực hiện được lời hứa, chúng vẫn sẽ không tạo ra một hệ sinh thái nội dung tốt. YouTube sẽ không thành công nếu mỗi người sáng tạo cần một camera RED Digital Cinema.
Việc tạo ra ảnh 3D lập thể (khá tốt!) trong Quest Instagram là một bước nhỏ hướng tới tương lai. Có những con đường dẫn đến video lập thể và 6DOF tĩnh, rồi cuối cùng là video 6DOF.
Hãy làm mọi thứ trở nên sống động, sau đó cho phép điều chỉnh tùy chỉnh cho các phương tiện nhận thức sống động.

12,02K
Hàng đầu
Thứ hạng
Yêu thích