Skip links

Google revela misteriosos modelos de imagen de IA que pueden editar hábilmente fotos

Un pequeño perro marrón con un collar turquesa se encuentra en una acera gris. En la imagen izquierda, la taza de viaje blanca con tapa azul "La ciudad" Al lado del perro; En la imagen correcta, la copa se pierde.
Rápidamente sacé la taza de café de esta foto usando el nuevo modelo de IA de Google.

Como se esperaba, el modelo de imagen AI se llama «nanobanana» Impresionado la semana pasada En realidad está hecho por Google. Gigante de la tecnología Anunciado anoche y su nombre real «Gemini 2.5 Flash Image».

«Esta actualización le permite fusionar múltiples imágenes en una sola imagen, mantener la consistencia de los personajes para mantener una rica narración de historias, transformaciones específicas utilizando el lenguaje natural y usar el conocimiento mundial de Gemini para generar y editar imágenes».

La empresa ha establecido Herramientas de red Para editar fotos, solía quitar la taza de las fotos del perro.

Interno de negocios declaración Hoy fue un «mal día» para Adobe. El sitio web dice que ha probado la imagen Flash Gemini 2.5 «durante unos días» y la encontró familiar al editar fotos.

par Indique que su capacidad para completar tareas, como cambiar el color de una prenda o agregar detalles como gafas humanas, es mejor que las aplicaciones comparables.

Adobe anunció que el nuevo modelo de IA de Google se integrará en Adobe Firefly y Adobe Express, destacando que su ecosistema sigue siendo un centro importante para los creadores que desean moverse sin problemas y colaborar en diferentes aplicaciones.

La cuadrícula de seis imágenes de estilo de cartas deportivas es una mujer llamada Liz Tran o Natalie D, cada una de las cuales desempeña un papel diferente: Chess Master, Racer, Archer, Skateboarder, desarrollador tecnológico y jugador de fútbol.
Google tiene la consistencia de roles del modelo, que puede «mantener la apariencia de un carácter u objeto en múltiples indicaciones y ediciones».
La comparación de lado a lado muestra a un hombre con una camisa negra con aretes en la camisa izquierda y roja sin aretes a la derecha, todo en la interfaz del software de edición de fotos.
‘Las imágenes flash Gemini 2.5 se pueden dirigir para la conversión y la edición local precisa utilizando un lenguaje natural. Por ejemplo, el modelo puede difuminar el fondo de una imagen, eliminar las manchas en una camiseta, eliminar a toda la persona de la foto, cambiar la postura del sujeto, agregar color a la foto en blanco y negro, o algo más que pueda llamar con puntas simples.
Una mujer con cuello de tortuga negro se encuentra en la escalera azul, sonriendo y tocando su rostro. La imagen más pequeña muestra su retrato, un par de gafas de sol y un teléfono inteligente verde.
Las imágenes Flash Gemini 2.5 pueden tomar diferentes fotos y crear una imagen única consistente. También puede editar fotos existentes.

La imagen flash Gemini 2.5, también conocida como nano plátano, se puede pasar Aprendizaje de Google.

Leave a comment

Home
Account
Cart
Search
¡Hola! ¡Pregúntame lo que quieras!
Explore
Drag