La startup de inteligencia artificial World Labs ha presentado su innovador proyecto: la capacidad de generar mundos en 3D utilizando únicamente una imagen en 2D. Esto significa que cualquier persona puede crear y explorar entornos tridimensionales a partir de imágenes bidimensionales.
«Hoy damos nuestro primer paso hacia la inteligencia espacial: un sistema de IA que transforma una única imagen en un mundo 3D. Esto te permite sumergirte en cualquier imagen y explorarlo en tres dimensiones», comentaron desde la empresa.
En el siguiente video se puede observar un breve ejemplo de la tecnología «Worlds» de World Labs, que convierte imágenes en 2D en mundos tridimensionales. Aunque el recorrido por estos entornos es limitado, representa un avance significativo en esta tecnología. En el sitio web de World Labs, hay ejemplos prácticos que muestran cómo funciona esta innovadora herramienta.
World Labs busca abordar los desafíos que enfrentan muchos creadores con los modelos de generación de IA actuales, como la falta de control y coherencia. Al recibir una imagen como entrada, su sistema estima la geometría 3D, completa las partes no visibles de la escena e inventa nuevos elementos, permitiendo una amplia variedad de estilos artísticos y tipos de escenas.
Las escenas 3D generadas pueden renderizarse en tiempo real en el navegador, ofreciendo un control total sobre la cámara. Esto permite a los usuarios explorar estos mundos de manera similar a un videojuego, e incluso simular efectos de cámara tridimensionales como la profundidad de campo o el zoom dolly.
A diferencia de la mayoría de los modelos generativos que predicen píxeles, predecir una escena 3D ofrece múltiples ventajas: la escena permanece inalterada al cambiar el ángulo de visión y se ajusta a las reglas básicas de la geometría tridimensional. La forma más sencilla de visualizar estas escenas es a través de un mapa de profundidad, donde cada píxel se colorea según su distancia a la cámara.
La creación de geometría 3D coherente permite interactuar con las escenas de diversas maneras, como modificar la iluminación, cambiar el aspecto general o insertar nuevos objetos. Además, es fascinante explorar los mundos ocultos detrás de obras maestras del arte, como el entorno que rodea la famosa cafetería del cuadro «Nighthawks» de Edward Hopper.
Las imágenes 3D generadas por World Labs también pueden ser alteradas con efectos de cámara, permitiendo simular profundidad de campo o lograr efectos fotográficos artísticos. Estos efectos 3D introducen la «realidad persistente», lo que significa que todo lo que observes permanecerá en su lugar, a diferencia de otras tecnologías de IA que cambian al desviar la mirada. Esto permite una experiencia interactiva en tiempo real que respeta las leyes físicas básicas de la geometría 3D.
World Labs fue fundada por Fei-Fei Li, una destacada científica informática y pionera en inteligencia artificial. Su sistema forma parte de una tendencia emergente en modelos de IA que pueden estimar y construir representaciones del entorno.
«Estos resultados son nuestro primer avance en la generación de mundos 3D. Estamos trabajando arduamente para mejorar tanto el tamaño como la fidelidad de nuestros mundos generados y explorando nuevas formas para que los usuarios interactúen con ellos», afirmaron desde World Labs.