Se pueden usar fotos aparentemente inofensivas para descifrar los agentes de IA

Autor Team Estudio Arquitectos

Publicado el: septiembre 15, 2025

Un hombre con uñas cuidadosamente recortadas poseía un teléfono inteligente y vio una publicación en las redes sociales en una playa tropical bajo un cielo azul claro sobre un fondo rosa. — Las fotos aparentemente inofensivas publicadas en las redes sociales se pueden usar para descifrar los agentes de IA.

Un nuevo estudio revela un nuevo tipo de amenaza cibernética asociada con los agentes de IA donde las fotos comunes se pueden cambiar para emitir comandos maliciosos en secreto.

Los agentes de IA son versiones avanzadas de los chatbots de IA y se consideran cada vez más como la siguiente área en el campo de la tecnología. Empresas como OpenAi han lanzado recientemente su propio Agente de AI de chatgpt. A diferencia de los chatbots, estos agentes de IA no solo responden preguntas, sino que también realizan tareas en la computadora del usuario, como abrir pestañas, enviar correos electrónicos y programar reuniones.

Sin embargo, En un nuevo estudio Los investigadores de la Universidad de Oxford descubrieron que las fotos se pueden cambiar en secreto, como fondos de pantalla, imágenes publicitarias e incluso imágenes publicadas en las redes sociales, por lo que mientras se ven exactamente como los humanos, contienen instrucciones ocultas que solo los agentes de IA pueden “ver”.

De acuerdo a Científico americano,,,,, Si el agente de IA encuentra una de estas imágenes con forma mientras trabaja (por ejemplo, nota una imagen en el fondo del escritorio del usuario en la captura de pantalla), puede malinterpretar el píxel como un comando. Esto puede causar cosas que los usuarios no solicitan, como compartir contraseñas o difundir imágenes maliciosas.

Por ejemplo, el coautor del estudio, Yarin Gal, es profesor asociado de aprendizaje automático en la Universidad de Oxford. Científico americano “Cómo la imagen de Taylor Swift en Twitter es suficiente para desencadenar una acción maliciosa de un agente en la computadora de alguien”. “A los ojos de una persona, esta foto se ve completamente normal. Sin embargo, la IA lo lee de manera diferente porque la computadora procesa la imagen como un ajuste digital, mientras que los ajustes de píxeles pequeños e invisibles pueden cambiar la IA que ve la IA.

Cualquier imagen que esté dañada, ya sea una foto de Taylor Swift, un gatito o una foto de Sunset, puede activar la computadora para que retuite esa imagen y luego haga algo malicioso, como enviar todas las contraseñas. Esto significa que la siguiente persona que ve su feed de Twitter y ve su feed de Twitter y se ejecuta también causará drogas a la computadora.

Se informa que el mayor riesgo de “código abierto” de IA es el mejor, y cualquiera puede usar este código. Esto facilita a los piratas informáticos descubrir cómo IA interpreta las fotos y cómo colarse en comandos ocultos.

Hasta ahora, los investigadores dicen que la amenaza solo ha aparecido en experimentos controlados y no se ha informado en el mundo real. Sin embargo, los autores del estudio advierten que la vulnerabilidad es real y esperan recordar a los desarrolladores antes de que los agentes de IA se vuelvan más comunes. El objetivo es crear salvaguardas para que estos sistemas de proxy de IA no puedan ser engañados por instrucciones ocultas en fotos diarias, dicen los investigadores.

Fuente de la imagen: Fotos de título por Reservar.