- Project Genie permite crear mundos interactivos en 3D a partir de texto o imágenes, apoyado en el modelo Genie 3 y otras IA de Google.
- El acceso está limitado a suscriptores de Google AI Ultra en EE. UU., con sesiones de 60 segundos y resolución cercana a 720p.
- Los mundos son dinámicos y remezclables, pero presentan baja tasa de fotogramas, cierto lag, fallos físicos y resultados irregulares.
- Project Genie se enmarca en la carrera por los modelos de mundo y la AGI, con implicaciones futuras para videojuegos, educación y simulación también en Europa.
Google DeepMind ha comenzado a abrir, de forma limitada, el acceso a Project Genie, un prototipo de investigación que permite generar mundos virtuales interactivos a partir de descripciones en lenguaje natural o imágenes. De momento, solo pueden probarlo los suscriptores del plan Google AI Ultra en Estados Unidos, pero la compañía ya ha dejado caer que su intención es ampliar su alcance a más territorios con el tiempo, algo que seguirán muy de cerca desarrolladores y estudios europeos.
Lejos de ser un producto acabado, Genie se presenta como un laboratorio vivo donde Google quiere observar cómo la gente usa estos modelos de mundo, recopilar datos y medir hasta qué punto esta tecnología puede servir como base para videojuegos, simulaciones, formación y nuevas formas de contenido interactivo. Aun con sus limitaciones actuales, deja ver hacia dónde podría ir la IA generativa aplicada a entornos 3D en los próximos años.
¿Qué es Project Genie y qué lo hace diferente?

En esencia, Project Genie es una plataforma experimental que toma un texto o una imagen y lo transforma en un escenario jugable en cuestión de segundos. La herramienta combina varios modelos de inteligencia artificial de Google: el world model Genie 3, el generador de imágenes Nano Banana Pro y el modelo multimodal Gemini, trabajando en cadena para pasar de una idea a un mundo navegable con un personaje controlable.
El usuario parte de un “boceto de mundo” en el que indica con palabras cómo quiere que sea el entorno y qué tipo de personaje o punto de vista desea: caminar, volar, conducir, montar a caballo, vista en primera o tercera persona, etc. A partir de ese guion, Nano Banana Pro genera una imagen previa del escenario que se puede retocar antes de dar el siguiente paso: convertirla en un espacio 3D interactivo con Genie 3.
La clave es que el modelo no se limita a crear un decorado estático, sino que simula la dinámica del entorno fotograma a fotograma. Funciona como un “motor de predicción” que va calculando el siguiente frame según las acciones del jugador, en lugar de un motor gráfico tradicional que renderiza una escena predefinida. Eso permite que las reglas del mundo puedan cambiar sobre la marcha, aunque hoy por hoy esa promesa convive con bastantes incoherencias visuales y físicas.
En esta fase inicial, Genie está más orientado a la exploración creativa que a ofrecer una experiencia pulida de juego. Su valor está en demostrar que un usuario sin conocimientos de programación puede pasar de una frase tipo “un castillo de nubes de malvavisco sobre un río de chocolate” a un mundo jugable en muy poco tiempo.
Cómo funciona la generación de mundos paso a paso

El flujo de uso de Project Genie está pensado para ser relativamente directo, al menos sobre el papel. Todo arranca con un breve formulario donde el sistema pregunta cómo es el mundo que quieres crear y qué rol va a tener el personaje principal. A partir de ahí, la propia IA va encadenando modelos:
- 1. Bocetado del mundo: el usuario describe el entorno (“una ciudad futurista de noche”, “una isla volcánica flotante”, “un océano con olas gigantes y un surfista”) y define el tipo de avatar y la forma de exploración.
- 2. Generación de imagen: Nano Banana Pro crea una imagen estática que representa ese escenario, que puede modificarse (colores, composición, estilo) para afinar el resultado.
- 3. Creación del mundo jugable: con esa imagen como base, Genie 3 genera un entorno interactivo en el que se pueden mover, saltar, volar o realizar otras acciones, con la cámara ajustable durante la partida.
- 4. Exploración y grabación: el usuario dispone de sesiones de hasta 60 segundos para recorrer el mundo. Al finalizar, es posible descargar un vídeo del recorrido.
- 5. Remezcla y galería: se pueden remezclar mundos existentes, tanto propios como de otros usuarios, o partir de una selección curada en una galería para crear nuevas variantes.
Además de los prompts de texto, Genie admite fotos reales como punto de partida. Por ejemplo, una instantánea de una montaña nevada puede usarse para generar un mapa de alta montaña con un escalador ágil, o la foto de una calle europea podría convertirse en un escenario explorables con estética de videojuego. Eso sí, los resultados no siempre mantienen la fidelidad esperada con la imagen original.
La experiencia actual está condicionada por varias restricciones técnicas. Los mundos se muestran en una resolución cercana a 720p, con una tasa de entre 20 y 24 fotogramas por segundo y un input lag apreciable, lo que provoca que el control del personaje se sienta algo torpe. No es casualidad: cada sesión reserva un chip completo para el usuario, y Google ha marcado un límite de tiempo para poder dar acceso simultáneo a más personas sin disparar los costes de computación.
Desde DeepMind insisten en que se trata de un prototipo y que el comportamiento puede ser irregular; en algunas ocasiones surgen mundos relativamente coherentes y jugables, mientras que en otras el sistema genera escenarios extraños, cambios bruscos en el terreno o animaciones poco naturales. Aun así, los investigadores hablan de “destellos” de algo que no se puede lograr de otra manera con la tecnología actual.
Primeras pruebas: creatividad, lag y clones de clásicos

Las pruebas realizadas por periodistas y creadores de contenido han puesto a la vista tanto el potencial creativo de Project Genie como sus carencias. En demos organizadas por Google se han recreado mundos de fantasía como castillos de nubes hechos de malvavisco sobre ríos de chocolate, así como entornos más realistas con nieve deformable o mares agitados con grandes olas turquesa.
En el otro extremo, algunos reporteros han intentado forzar al sistema hacia terrenos más delicados, como la recreación de videojuegos icónicos. Utilizando descripciones cuidadas, se han generado mundos claramente inspirados en títulos como Super Mario 64, Metroid Prime o The Legend of Zelda: Breath of the Wild, con elementos que recuerdan no solo al estilo visual, sino también a ciertas mecánicas de juego. En el caso de un escenario tipo Zelda, el personaje llegó incluso a desplegar una especie de paravela al saltar, lo que sugiere que el modelo ha aprendido patrones muy específicos de vídeos de jugabilidad disponibles en la web.
El problema es que la experiencia, más allá del efecto “wow” inicial, está todavía lejos de ser sólida: el límite de 60 segundos por sesión corta las partidas de raíz, la baja tasa de fotogramas afecta a la fluidez y la latencia en los controles hace que manejar al personaje resulte frustrante para cualquiera acostumbrado a un juego comercial.
También aparecen fenómenos propios de este tipo de modelos: caminos que se convierten súbitamente en hierba, trazos de pintura que se desvanecen sin motivo aparente o personajes que atraviesan muros y objetos sólidos sin respetar ninguna física creíble. Todo ello refuerza la idea de que Genie no es aún un sustituto de un motor como Unity o Unreal, sino un experimento de alto nivel sobre cómo podría funcionar un “motor de IA pura”.
Aun así, para muchos equipos creativos el valor no está tanto en jugar con estos mundos durante horas, sino en poder probar ideas de manera casi instantánea, ver qué tipo de ambiente genera la IA con un prompt concreto y, a partir de ahí, replantear el diseño de un proyecto más grande.
Propiedad intelectual, seguridad y moderación de contenidos
La posibilidad de generar mundos que recuerdan a franquicias existentes ha encendido todas las alarmas en materia de propiedad intelectual. En las primeras pruebas, Project Genie permitió crear sin grandes obstáculos escenarios muy similares a los de ciertas sagas famosas, lo que llevó a Google a endurecer las restricciones justo antes de la publicación de algunos artículos.
En particular, la compañía ha bloqueado la creación de mundos asociados con nombres protegidos, como “Mario”, y ha implementado filtros que impiden directamente introducir ciertos términos o referencias explícitas. En otros casos, cuando los usuarios describen únicamente la apariencia física de personajes o elementos de una marca, el sistema sí genera mundos que evocan esos universos sin mencionarlos por su nombre, lo que deja claro que la moderación automática va a ser un terreno complejo.
DeepMind reconoce que mantiene activas distintas medidas de seguridad destinadas a frenar contenidos inadecuados o que puedan vulnerar derechos de terceros. La compañía ya sabe lo que es recibir avisos formales —como una carta de cese y desistimiento de Disney por usos previos de modelos generativos— y prefiere pecar de prudencia mientras ajusta el comportamiento del sistema.
La combinación de modelos entrenados con grandes cantidades de material público y un acceso, aunque limitado, a usuarios finales plantea preguntas que en Europa ya están encima de la mesa, especialmente con el nuevo marco regulatorio de IA. A medida que Project Genie llegue a más regiones, será clave comprobar cómo se adapta a las exigencias legales europeas sobre transparencia, derechos de autor y gestión del contenido generado.
Para desarrolladores y empresas del sector creativo en España y otros países de la UE, esta fase inicial sirve como campo de observación: se puede ir tomando nota de cómo Google aborda la moderación y pensar desde ya en modelos de negocio que respeten la propiedad intelectual cuando estas herramientas estén disponibles de forma más amplia.
Modelos de mundo y carrera hacia la AGI

Más allá del uso lúdico, Project Genie encaja en la estrategia de Google DeepMind por avanzar en los llamados modelos de mundo, una pieza que muchos investigadores consideran esencial en el camino hacia una inteligencia artificial más general. A diferencia de otros sistemas que solo generan imágenes o vídeos aislados, un world model busca representar internamente un entorno y predecir cómo evolucionará en función de las acciones que se realicen en él.
DeepMind tiene una larga trayectoria de agentes de IA que han dominado juegos concretos como el ajedrez o el Go, pero esos entornos son muy cerrados y perfectamente definidos. El desafío para una IA de propósito general es gestionar contextos variados, con reglas ambiguas y elementos poco predecibles, algo mucho más cercano a cómo funciona el mundo real.
Con Genie 3, Google intenta demostrar que un único modelo puede manejar múltiples tipos de escenarios, desde paisajes fantásticos hasta simulaciones más ancladas en la realidad, generando movimiento, interacciones y físicas consistentes. Sobre el papel, este tipo de tecnología puede aplicarse a robótica, navegación en espacios complejos, animación avanzada o exploración de lugares históricos recreados digitalmente.
La liberación de Project Genie se produce además en un contexto de competencia creciente en este campo. Empresas y laboratorios como World Labs —liderado por Fei-Fei Li con su producto Marble—, la startup de vídeo generativo Runway o AMI Labs, el nuevo proyecto de Yann LeCun, están desarrollando sus propios modelos de mundo. Es muy probable que, en los próximos años, veamos un ecosistema en el que distintos agentes compitan por ofrecer las mejores simulaciones, con implicaciones directas para los sectores del entretenimiento y la industria en Europa.
Para universidades, centros de investigación y empresas tecnológicas europeas, este panorama abre opciones de colaboración y también de regulación: se trata de un campo donde la UE quiere tener voz propia, tanto desde el punto de vista científico como desde el regulatorio.
Oportunidades y retos para desarrolladores y startups en Europa
Aunque el acceso oficial a Project Genie se limita por ahora a los suscriptores de Google AI Ultra en Estados Unidos y mayores de 18 años, su evolución va a ser observada con lupa por startups de videojuegos, edtech o simulación en España y el resto de Europa. La razón es simple: una herramienta capaz de generar prototipos jugables o escenarios de prueba en cuestión de segundos supone un atajo importante frente a los procesos tradicionales.
Equipos pequeños podrían utilizar plataformas de este tipo para validar mecánicas de juego, experimentar con diferentes estilos visuales o construir demos rápidas para inversores y socios, reduciendo el tiempo y el coste asociados a la preproducción. En sectores como la formación corporativa o la educación, también asoma la posibilidad de crear entornos inmersivos personalizados para explicar conceptos complejos, practicar procedimientos o simular situaciones de riesgo sin necesidad de grandes presupuestos.
Ahora bien, esta ventana de oportunidad viene acompañada de varios desafíos. Por un lado, la calidad y estabilidad de los mundos generados todavía está lejos del nivel necesario para un lanzamiento comercial, por lo que cualquier proyecto serio tendría que combinar estos modelos con tecnologías más maduras. Por otro, el debate sobre el origen de los datos de entrenamiento, los derechos sobre el contenido resultante y las obligaciones legales en la UE añade una capa de complejidad que las empresas europeas no pueden ignorar.
De cara a los próximos años, lo más sensato para el ecosistema europeo parece ser ir monitorizando el desarrollo de Project Genie, participar en programas de prueba cuando se abran a otros territorios y explorar alianzas con socios tecnológicos que permitan integrar este tipo de modelos de forma responsable. Estar bien posicionado cuando el acceso se amplíe podría marcar la diferencia entre llegar a tiempo o quedarse atrás.
Con todo lo visto hasta ahora, Project Genie se sitúa como uno de los experimentos más llamativos en el cruce entre IA generativa y mundos interactivos: un sistema todavía verde, con lag, límites estrictos y resultados impredecibles, pero que apunta a una forma distinta de crear y explorar entornos digitales que, tarde o temprano, terminará influyendo en cómo se diseñan videojuegos, simulaciones y experiencias inmersivas también desde España y el resto de Europa.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.