- Audio nativo en todas las herramientas de Flow: diálogos, ambiente y efectos sincronizados
- Mayor adherencia al prompt y mejores resultados en imagen a vídeo
- Nuevos controles de edición: Ingredientes, Fotogramas, Extender e Insertar; Eliminar llegará pronto
- Disponibilidad en Flow, app de Gemini, Vertex AI y API de Gemini
Google ha puesto al día su modelo de generación de vídeo con Veo 3.1, una iteración centrada en calidad audiovisual, control creativo y fiabilidad. La compañía integra mejoras clave en su editor y en la comprensión de instrucciones para agilizar la creación de piezas con aspecto cinematográfico.
La novedad más visible está en el audio nativo, ahora presente en todo el flujo de trabajo: diálogos, ambiente y efectos se producen de forma sincronizada con lo visual. Además, Flow incorpora ajustes que facilitan afinar escenas, reducir pruebas y mantener coherencia entre tomas.
Qué es Veo 3.1 y qué cambia respecto a Veo 3
Basado en Veo 3, el nuevo modelo prioriza la adherencia al prompt y la precisión en salidas de vídeo y sonido. Google señala que el ajuste reduce iteraciones innecesarias, aportando más control y resultados consistentes con lo solicitado.
La actualización llega tras meses de uso intensivo de Flow por parte de los creadores, con cientos de millones de clips generados desde su lanzamiento. Ese aprendizaje se traduce en una interpretación más fiable de escenas complejas, más realismo en texturas y mejor continuidad entre planos.
La compañía también refuerza el soporte de formatos con aspecto 16:9, tanto en horizontal como en vertical, para integrarse mejor en entornos multiplataforma y flujos de publicación actuales.
Integración de audio nativo y formatos compatibles
Con Veo 3.1, el sonido se genera de forma sincronizada y contextual en todas las herramientas de Flow: ambiente, efectos y voces se alinean con cada plano sin depender de posproducción externa.
El modelo produce clips base de unos 8 segundos a resolución 1080p y 24 FPS, con posibilidad de ampliación sin perder coherencia temporal. También admite formato vertical 9:16, pensado para distribución en móviles.
Estas capacidades de audio se extienden a funciones que antes eran silenciosas, permitiendo que lo que se oye evolucione junto a lo que se ve y ahorrando pasos en el montaje final.
Herramientas de Flow: control y edición
Flow incorpora controles que ayudan a dirigir la narrativa visual. En Ingredientes para video, se pueden subir varias imágenes de referencia para fijar personajes, objetos y estilo, manteniendo consistencia entre planos.
La función Fotogramas para video genera la transición entre una imagen inicial y otra final, útil para definir arranque y cierre de una escena y reducir el tiempo de prueba y error.
Con Extender, es posible prolongar clips más allá del minuto, enlazando segmentos con continuidad visual y sonora para construir tomas largas o narrativas más pausadas.
En el apartado de edición, Insertar permite añadir elementos a una toma existente respetando iluminación, sombras y perspectiva. La opción Eliminar está prevista para llegar próximamente: su objetivo es retirar objetos no deseados y reconstruir el fondo de forma natural.
Rendimiento, límites y calidad
Veo 3.1 muestra avances en coherencia de personajes entre fotogramas y en la representación de física básica (gravedad, colisiones o fluidos), además de mejoras en imagen a vídeo, con mejor preservación de detalles finos.
Como ocurre con la IA generativa, pueden aparecer artefactos puntuales, sobre todo en escenas de movimiento rápido o transiciones complejas. La sincronización labial ha mejorado, aunque aún requiere retoques en producciones exigentes.
Google aplica marcas de agua visibles y SynthID (identificación digital por fotograma) para la trazabilidad del contenido generado, una medida que no se puede desactivar.
Disponibilidad y cómo probarlo
Veo 3.1 se despliega en Flow, la app de Gemini, Vertex AI y la API de Gemini para desarrolladores. La disponibilidad puede variar por región y es probable que algunas funciones avanzadas requieran una suscripción.
Para equipos técnicos y empresas, el acceso vía Vertex AI y API facilita integrar el modelo en herramientas internas, mientras que creadores individuales pueden experimentar desde la app de Gemini o el editor Flow.
Competidores y usos prácticos
Frente a Sora 2 de OpenAI, Veo 3.1 enfatiza el control del usuario durante la creación (puntos de referencia con imágenes, edición de escena y audio integrado). Sora 2 destaca por su enfoque en realismo, por lo que la elección depende del objetivo creativo.
En marketing, periodismo y educación, estas funciones permiten prototipar ideas, crear visualizaciones explicativas y producir clips temáticos sin rodaje tradicional, acelerando la entrega de contenidos.
Con esta actualización, Google afina la fórmula: más control, audio integrado y mejores herramientas de edición para que el creador pueda dirigir la historia con menos fricción, manteniendo formatos y flujos compatibles con las principales plataformas.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.