El nuevo modelo de vídeo Gemini Omni AI de Google puede hacer locuras
El nuevo modelo de inteligencia artificial (IA) Gemini Omni de Google puede hacer algunas locuras. Clave del modelo promesa Simplemente crea cualquier cosa a partir de cualquier cosa.
Google dice que su nuevo modelo Gemini Omni puede “crear cualquier contenido a partir de cualquier entrada”, incluido audio, vídeo, fotos y texto. El modelo comienza con la generación de vídeo, que luego el usuario puede editar mediante un diálogo textual con Gemini. El primer modelo, Gemini Omni Flash, ya está disponible en la aplicación Gemini, Google Flow y YouTube Shorts.
Como explica Google, editar vídeos generados por IA utilizando texto es fácil. El modelo también promete mantener la coherencia después de la edición, incluidos los personajes, y el Omni puede recordar lo que era visible en escenas anteriores.
La compañía incluso promete que Gemini Omni puede utilizar su “comprensión intuitiva de la física” para “cerrar la brecha entre el fotorrealismo y la narración significativa” de manera efectiva.
Los usuarios han logrado resultados impresionantes con Gemini Omni. Por ejemplo, el ex gerente de producto de Google, Bilawal Sidhu, le dio a Gemini Omni una foto con un boceto de la trayectoria del dron y le pidió a la inteligencia artificial que generara una toma POV del dron.
A Google Omni se le dio un bosquejo de la trayectoria de la cámara y se le pidió que generara imágenes POV de drones. pic.twitter.com/cQZFMtOkEi
-Bilawalsidhu (@bilawalsidhu) 26 de mayo de 2026
bordeAllison Johnson llama ‘salvaje’ a Omni y tiene inteligencia artificial Dándole vida al animal de peluche de su hijo, Buddy.. Buddy emprende emocionantes aventuras de IA, como rafting y snowboard.
“Los resultados fueron mixtos y confusos. Algunos de los resultados fueron muy buenos, más consistentes y realistas que cuando probé Veo hace cinco meses”, escribió Johnson. “Pero incluso en los mejores clips que Omni ha producido para mí, todavía hay ciertos sobresaltos de la IA, como que Buddy cambia repentinamente de dirección mientras salta en paracaídas”.
Como lo probó Johnson, el mayor reclamo de fama de Omni es su capacidad para combinar una variedad de medios de entrada con video generado por IA, pasando de una tecnología impresionante a una potencialmente peligrosa. Uno de sus deepfakes convenció incluso a su marido, “un hombre que básicamente me vio en la vida real”. todos los días durante los últimos diez años”.
Si esto es bueno o terrible depende de a quién se le pregunte.
“No puedo ser el único que piensa que esto no tiene razón de existir”, escribió near_photography en Threads en respuesta a la publicación anterior de Johnson. “Esta capacidad no proporcionaría ningún beneficio neto a la sociedad”.
Como señala Google, todos los videos generados con Omni incluyen su “imperceptible marca de agua digital SynthID”, que permite a los usuarios confirmar fácilmente si algo está siendo utilizado por la inteligencia artificial de Google en Gemini, Gemini en Chrome y Google Search. ¿Pero qué pasa si alguien no utiliza estas plataformas?
Por ejemplo, Google está incorporando la tecnología directamente a YouTube Shorts y YouTube Create, pero no hay forma de predecir para qué la usará la gente.
Fuente de la imagen: Google