Google presenta Gemini Omni Flash, un modelo multimodal capaz de generar y editar vídeos desde texto, imágenes, audio y clips previos. La batalla por la creación audiovisual con IA entra en una nueva fase.
La inteligencia artificial ya no solo escribe o genera imágenes: ahora quiere dirigir, editar y producir vídeo.
Con Gemini Omni, Google busca convertir la creación audiovisual en una conversación.
Qué es Gemini Omni Flash
Gemini Omni Flash es el primer modelo de la nueva familia Gemini Omni de Google DeepMind. Permite crear y editar vídeo a partir de combinaciones de texto, imágenes, audio y vídeo.
La herramienta llega a la app de Gemini, a Google Flow y a funciones de YouTube Shorts. Google la define como una especie de “Nano Banana para vídeo”, con edición mediante instrucciones en lenguaje natural.
Qué novedades incluye
La gran diferencia frente a otros modelos es que Omni no parte solo de un prompt escrito. Puede usar vídeos, fotos, referencias visuales y audio para generar nuevos clips.
Entre sus funciones principales destacan:
edición conversacional, continuidad de personajes, mayor coherencia de escenas, comprensión física más realista, generación de clips con audio y marca de agua digital SynthID en los contenidos generados.
En su lanzamiento, los clips generados están limitados a unos 10 segundos, aunque Google ya plantea ampliar capacidades más adelante.
A quién va dirigida esta IA
Gemini Omni apunta directamente a creadores de contenido, editores de vídeo, marcas, profesores, pequeñas empresas y usuarios de YouTube Shorts.
Su gran objetivo es democratizar la producción audiovisual: que una persona sin equipo profesional pueda generar piezas visuales rápidas para redes, explicaciones educativas, anuncios, prototipos o contenido viral.
Cómo puede cambiar el vídeo online
El impacto puede ser enorme. Si la herramienta funciona bien, reducirá el coste de crear vídeos y multiplicará la cantidad de contenido generado por IA en internet.
También puede cambiar el trabajo de editores y creadores: menos tareas repetitivas, más rapidez para probar ideas y más competencia en plataformas como YouTube, TikTok o Instagram.
Pero el riesgo también es evidente: más vídeos falsos, más saturación de contenido y más necesidad de verificar qué es real y qué ha sido generado por IA.
Opinión: una herramienta potente, pero con dudas
Gemini Omni parece un salto importante, sobre todo por la edición conversacional y la integración con YouTube. Google tiene una ventaja clara: controla buscador, Android, Gemini y YouTube.
Pero todavía hay límites. Las primeras pruebas apuntan a resultados impresionantes, aunque también con errores visuales, incoherencias y momentos poco naturales.
La clave será si Google consigue hacer que Omni sea fiable, barato y fácil de usar. Si lo logra, puede convertirse en una herramienta cotidiana para millones de creadores.
Qué se puede esperar ahora
Lo más probable es que Google integre Gemini Omni cada vez más en YouTube Shorts, Google Flow, publicidad, educación y herramientas para empresas.
La batalla ya no será solo por quién genera el vídeo más bonito, sino por quién controla el ecosistema donde ese vídeo se crea, se publica, se monetiza y se recomienda.
Gemini Omni no es solo una IA de vídeo: es una pieza más en la guerra por dominar la creatividad digital.
