Gemini Omni permite crear en base a texto, imágenes, audio y videos. Imagen: Google

Tendencias

19 de Mayo de 2026

Google lanza Gemini Omni, un modelo IA que permite crear videos “hablando” con la herramienta

La nueva herramienta de Google permite a cualquier persona generar clips realistas usando textos, fotos o audios, acercando la edición profesional al público general.

Por Eduardo Woo, desde Mountain View

Google dio un nuevo paso en la carrera por la inteligencia artificial generativa y presentó Gemini Omni Flash, un modelo diseñado específicamente para la creación y edición de video mediante comandos conversacionales.

La herramienta, anunciada en el evento Google I/O desde Mountain View, forma parte de una nueva familia de modelos multimodales capaces de combinar texto, imágenes, audio y video para generar clips audiovisuales de alta calidad. Según explicó la compañía, el sistema busca ir más allá de la generación de imágenes estáticas e integrar directamente las capacidades de razonamiento de Gemini con la producción audiovisual.

Uno de los puntos centrales del anuncio es la posibilidad de editar videos usando lenguaje natural. Es decir, los usuarios pueden “conversar” con la IA para modificar escenas, cambiar acciones, transformar ambientes o ajustar detalles específicos sin necesidad de herramientas de edición tradicionales. Todo esto, manteniendo la coherencia visual de personajes y escenas.

Desde Google también destacaron que Gemini Omni Flash mejora la comprensión de elementos físicos como gravedad, movimiento o dinámica de fluidos, permitiendo resultados más realistas en las secuencias generadas. A ello se suma la capacidad de transformar instrucciones breves en contenido visual explicativo para conceptos complejos.

El sistema admite distintos formatos de entrada para iniciar proyectos. Se pueden utilizar fotografías, bocetos, clips y referencias de voz para orientar la creación del video, aunque por ahora las funciones de audio están limitadas principalmente a comandos hablados.

En materia de seguridad, Google aseguró que todos los videos creados con Omni Flash incluirán SynthID, una marca de agua digital imperceptible que permite identificar contenido generado mediante inteligencia artificial. Además, las funciones relacionadas con modificar voces o discursos de terceros aún se encuentran bajo evaluación antes de ser liberadas masivamente.

Gemini Omni Flash comenzó su despliegue este 19 de mayo para suscriptores de Google AI Plus, Pro y Ultra a través de Gemini y Google Flow. Durante esta semana, la compañía también habilitará la tecnología en YouTube Shorts y YouTube Create App sin costo adicional para creadores.