Google DeepMind ha dado un paso significativo en el campo de la inteligencia artificial con el lanzamiento de Genie 2, un modelo avanzado capaz de generar mundos 3D jugables a partir de una imagen estática. Este sistema promete transformar la creación de videojuegos y otros entornos interactivos, posicionándose como un competidor directo del sistema recientemente anunciado por World Labs.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



Genie 2 es un modelo de IA desarrollado por Google DeepMind que puede generar entornos 3D interactivos a partir de una sola imagen. A diferencia de su predecesor, que solo podía crear mundos en 2D, Genie 2 permite la creación de mundos tridimensionales con mayor profundidad y realismo. Este modelo utiliza un enfoque de difusión para generar imágenes mientras el jugador, ya sea un humano o un agente de IA, se mueve a través del mundo simulado.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



​Google DeepMind es una subsidiaria de Google especializada en inteligencia artificial. DeepMind ha sido pionera en el uso de modelos de IA para diversas aplicaciones, y Genie 2 es su último avance en la creación de entornos interactivos. El anuncio oficial se realizó el 4 de diciembre de 2024 a través del blog oficial de DeepMind y a través de las redes sociales. La noticia ha sido cubierta por varios medios especializados en tecnología y videojuegos, destacando el potencial revolucionario de este nuevo modelo.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



Genie 2 no solo mejora la calidad y realismo de los entornos generados, sino que también permite una mayor interactividad y dinamismo en los juegos y otras aplicaciones. La capacidad de Genie 2 para recordar partes de una escena simulada y reconstruirlas con precisión cuando vuelven a ser visibles es una característica destacada que lo diferencia de otros modelos similares, a excepción del de World Labs que también consigue el mismo efecto.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



​El proceso de generación de mundos 3D, tanto con Genie 2 como con el de World Labs, comienza con una imagen estática, que puede ser una fotografía del mundo real o una imagen generada por un modelo de texto a imagen basado en Inteligencia Artificial. A partir de esta imagen, se crea un entorno interactivo donde los usuarios pueden moverse, explorar e interactuar. Ambos modelos son capaces de simular efectos físicos, y pueden manejar diferentes perspectivas, incluyendo vistas en primera persona e isométricas.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



​Aunque Genie 2 puede generar mundos 3D de alta calidad, su capacidad para mantener la consistencia de estos mundos es limitada. DeepMind ha indicado que el modelo de Genie 2 puede generar mundos consistentes durante hasta 60 segundos, aunque la mayoría de los ejemplos compartidos duran entre 10 y 20 segundos. A medida que el tiempo de generación se prolonga, pueden aparecer artefactos y la calidad de la imagen puede disminuir. Por otra parte, el modelo de World Labs tiene limitaciones similares. Sin embargo, este segundo modelo ha optado por, en lugar de reducir el tiempo de generación de imágenes 3D, reducir el espacio en el que podemos movernos.



Vídeo de demostración de Genie 2. Créditos: Google DeepMind.



​Ambos modelos tienen una amplia gama de aplicaciones potenciales. Además de su uso en la creación de videojuegos, pueden ser herramientas valiosas para artistas y diseñadores que buscan prototipar rápidamente ideas y entornos. DeepMind también ve el potencial de Genie 2 para entrenar y evaluar otros agentes de IA, proporcionando un entorno rico y diverso para el aprendizaje y la investigación.

Anuncio Instant Gaming
Anuncio



​Con su capacidad para generar entornos realistas y dinámicos a partir de una sola imagen, ambos modelos tienen el potencial de revolucionar la industria de los videojuegos y más allá, ofreciendo nuevas posibilidades para la creatividad y la investigación en IA.