Houve muitos equipamentos malucos de muitas câmeras criados com o objetivo de capturar vídeo espacial completo.  Lembro-me de uma conversa na Meta que era basicamente "vamos nos apoiar o máximo possível na visão computacional geométrica clássica antes de olhar para algoritmos de aprendizado de máquina", e eu apoiei essa direção. Isso foi há muitos anos, quando o ML ainda parecia uma alquimia imprevisível e, claro, você deseja maximizar o uso da verdade básica! O esforço de engenharia hardcore foi para a calibração, sincronização e processamento de dados da câmera, mas nunca realmente entregou a visão. Não importa quantas câmeras você tenha, qualquer objeto em movimento complexo terá áreas ocluídas, e "buracos na realidade" se destacam fortemente para um espectador que não está exatamente em um dos pontos da câmera. Mesmo quando você tem boa visibilidade, as ambiguidades na fotogrametria multicâmera tornam as coisas menos precisas do que você gostaria. Houve também alguns experimentos para ver o quão bom você poderia fazer a reconstrução da cena 3D das câmeras Quest usando computação offline, e a resposta ainda era "não muito boa", com superfícies bastante irregulares. Muitas reconstruções 3D parecem incríveis rolando no feed do seu telefone, mas não tão boas ampliadas para uma renderização VR totalmente imersiva e colocadas em contraste com uma foto tradicional de alta qualidade. Você realmente precisa de antecedentes fortes para resolver o problema de ajuste e preencher as lacunas de cobertura. Para cenas arquitetônicas, você pode obter alguma quilometragem de priores planares simples, mas a IA generativa moderna é a prioridade definitiva. Mesmo que os equipamentos de câmera malucos cumprissem totalmente a promessa, eles ainda não teriam permitido um bom ecossistema de conteúdo. O YouTube não teria sucesso se todos os criadores precisassem de uma câmera RED Digital Cinema. A (muito boa!) geração de fotos 3D estereoscópicas no Quest Instagram é um pequeno passo em direção ao futuro. Existem caminhos para vídeo estéreo e 6DOF estático e, eventualmente, para vídeo 6DOF. Torne tudo imersivo e, em seguida, permita o ajuste personalizado da mídia imersiva.
162,24K