Saltar enlaces

El nuevo modelo de vídeo Gemini Omni AI de Google puede hacer locuras

El nuevo modelo de inteligencia artificial (IA) Gemini Omni de Google puede hacer algunas locuras. Clave del modelo promesa Simplemente crea cualquier cosa a partir de cualquier cosa.

Google dice que su nuevo modelo Gemini Omni puede “crear cualquier contenido a partir de cualquier entrada”, incluido audio, vídeo, fotos y texto. El modelo comienza con la generación de vídeo, que luego el usuario puede editar mediante un diálogo textual con Gemini. El primer modelo, Gemini Omni Flash, ya está disponible en la aplicación Gemini, Google Flow y YouTube Shorts.

Como explica Google, editar vídeos generados por IA utilizando texto es fácil. El modelo también promete mantener la coherencia después de la edición, incluidos los personajes, y el Omni puede recordar lo que era visible en escenas anteriores.

Consejo: haz una escultura con burbujas.

La compañía incluso promete que Gemini Omni puede utilizar su “comprensión intuitiva de la física” para “cerrar la brecha entre el fotorrealismo y la narración significativa” de manera efectiva.

Consejos: Las canicas ruedan rápidamente en una pista estilo reacción en cadena y se disparan de forma continua y suave.

Los usuarios han logrado resultados impresionantes con Gemini Omni. Por ejemplo, el ex gerente de producto de Google, Bilawal Sidhu, le dio a Gemini Omni una foto con un boceto de la trayectoria del dron y le pidió a la inteligencia artificial que generara una toma POV del dron.

bordeAllison Johnson llama ‘salvaje’ a Omni y tiene inteligencia artificial Dándole vida al animal de peluche de su hijo, Buddy.. Buddy emprende emocionantes aventuras de IA, como rafting y snowboard.

“Los resultados fueron mixtos y confusos. Algunos de los resultados fueron muy buenos, más consistentes y realistas que cuando probé Veo hace cinco meses”, escribió Johnson. “Pero incluso en los mejores clips que Omni ha producido para mí, todavía hay ciertos sobresaltos de la IA, como que Buddy cambia repentinamente de dirección mientras salta en paracaídas”.

Consejo: convierta esto a metraje real, use el dibujo solo como guía de movimiento, no muestre el dibujo en la película final.

Como lo probó Johnson, el mayor reclamo de fama de Omni es su capacidad para combinar una variedad de medios de entrada con video generado por IA, pasando de una tecnología impresionante a una potencialmente peligrosa. Uno de sus deepfakes convenció incluso a su marido, “un hombre que básicamente me vio en la vida real”. todos los días durante los últimos diez años”.

Si esto es bueno o terrible depende de a quién se le pregunte.

“No puedo ser el único que piensa que esto no tiene razón de existir”, escribió near_photography en Threads en respuesta a la publicación anterior de Johnson. “Esta capacidad no proporcionaría ningún beneficio neto a la sociedad”.

Consejo: aplica las poses y movimientos del vídeo de entrada al personaje proporcionado en esta imagen. Aplicar estilos desde la referencia de la imagen al nuevo video.

Como señala Google, todos los videos generados con Omni incluyen su “imperceptible marca de agua digital SynthID”, que permite a los usuarios confirmar fácilmente si algo está siendo utilizado por la inteligencia artificial de Google en Gemini, Gemini en Chrome y Google Search. ¿Pero qué pasa si alguien no utiliza estas plataformas?

Por ejemplo, Google está incorporando la tecnología directamente a YouTube Shorts y YouTube Create, pero no hay forma de predecir para qué la usará la gente.


Fuente de la imagen: Google

Home
Account
Cart
Search
¡Hola! ¡Pregúntame lo que quieras!
Explore
Drag