Twins digitales: simulando humanos con IA generada
Resumen:
Los gemelos digitales son un modelo individual específico basado en Genai que puede usarse para predecir las preferencias y comportamientos a nivel individual y de población.
Seamos realistas: lleva tiempo realizar investigaciones con usuarios reales. Reclutar participantes, recopilar datos y esperar los resultados son a menudo las etapas más que requieren mucho tiempo del proceso de investigación. Una de las formas más emocionantes y prometedoras de mejorar la eficiencia del dominio, incluida la investigación de usuarios, es usar AI generada.
¿Se puede estudiar más rápido o más escalable a través de AI? En otro lugar, describí Investigar nuestro campo debe hacerse Aprenda cómo la IA generativa respalda la investigación UX y el comportamiento. Hoy, me concentro en una dirección particularmente prometedora y sensible: Use modelos AI para simular el comportamiento humano.
¿Qué son los gemelos digitales?
uno Gemelos digitales es un modelo generativo, generalmente basado en Big Language Model (LLM) – Intente actuar como agente para una persona específica. El modelo puede responder nuevas preguntas o situaciones de la misma manera.
Piense en ello como Clonación cognitiva artificial: Un sistema que puede completar encuestas, selecciones predictivas o interacciones en tiempo real en tiempo real en nombre de individuos reales. Los gemelos son información personal capacitada o iniciada, como información demográfica, respuestas de encuestas anteriores, entrevistas, registros de comportamiento, se pueden utilizar para predicciones. Nivel personal comportamiento (¿qué hará esa persona) y Nivel de población Comportamiento (¿Qué hará el grupo de usuarios).
Usuarios sintéticos y gemelos digitales: continuidad
Al simular humanos con IA, podemos distinguir entre dos métodos amplios:
- Sintetizar a los usuarios Representa un segmento o prototipo de población (por ejemplo, «profesionales médicos en América Latina»). Son generados por descriptores a nivel de grupo y se utilizan para hacer predicciones a nivel de población.
- Gemelos digitales representar Individuos específicosmodele sus posibles pensamientos y acciones. Estas representaciones de individuos pueden usarse para predecir el comportamiento a nivel individual o a nivel de población.
Sin embargo, en realidad, la diferencia entre gemelos digitales y usuarios sintéticos es vaga. Imagina un continuo:
- Por un lado, los usuarios completos están construidos por atributos compartidos por muchas personas reales.
- En el otro extremo, los gemelos digitales se basan en la información recopilada sobre muy pocas personas, generalmente solo una.

A veces, los usuarios sintéticos generados en función de la información demográfica, como una descripción similar a un carácter. Y utilizando menos información para crear gemelos digitales, menos probabilidades es de coincidir con un individuo en particular y actuar como un usuario sintético correspondiente a un grupo más grande.
Casos de uso para gemelos digitales
Predecir las preferencias y comportamientos personales
Ser capaz de predecir cómo la respuesta de una persona en particular a los estímulos tiene un valor obvio en UX, marketing y ciencias sociales. Los ejemplos incluyen:
- Interpolación de datos faltante: Use las predicciones de los gemelos para completar los elementos de la encuesta omitidos.
- Encuesta más corta: Pregunte solo una parte de las preguntas del encuestado y luego infiera el resto de los gemelos.
- Participantes difíciles de llegar: Use datos de entrevistas únicas para crear gemelos que representen grupos costosos o poco prácticos que puedan ser reclutados repetidamente y con el tiempo.
- Orquestación del viaje: Espere que los usuarios respondan a diferentes puntos de contacto y adapten la experiencia en consecuencia.
- Problemas de disponibilidad: Las barreras de disponibilidad predeterminadas o las respuestas emocionales a los cambios de interfaz.
Tendencias de pronóstico en los niveles de población
Aunque los gemelos se construyen a nivel individual, sus resultados pueden agregarse para revelar tendencias más amplias a nivel de población. Permitirán a los investigadores simular cómo toda la audiencia responde a nuevas características, diseños o información, sin reclutar cientos o miles de anticipación.
Al aplicar pesos de muestreo que reflejan la estructura de la población objetivo, los gemelos digitales pueden describir la representatividad de la encuesta y apoyar las pruebas de comportamiento a gran escala antes de cualquier despliegue del mundo real.
¿Cómo construir gemelos digitales?
La construcción de gemelos digitales depende de la información contextual sobre el individuo y de cómo esta información se integra en el modelo.
La información de contexto específica personalmente puede incluir:
- Atributos demográficos
- Preferencias y creencias establecidas, generalmente en forma de un resumen similar a un personaje
- Respuestas de encuesta anteriores
- Entrevista
- Datos de comportamiento: como un sitio web anterior que una persona ha visitado o un producto que compró
Una vez agregada, esta información de contexto debe alimentarse con el modelo. Esto se puede hacer de varias maneras. La ruta elegida depende del presupuesto, la disponibilidad de datos, el nivel de experiencia técnica disponible y cómo se utilizan gemelos digitales.
Mejora rápidamente
Este enfoque construye gemelos agregando el contexto personal correspondiente al mensaje LLM. Aunque esto es fácil de lograr, puede encontrar limitaciones oportunas cuando un solo contexto es demasiado grande.
Búsqueda de la generación autorizada (trapo)
Utilizando este método, toda la información relevante (como el historial personal y otra información específica del dominio) está codificada en una fuente de datos externa. Para cada aviso, el documento más relevante de la fuente de datos externa se recupera y se adjunta a la solicitud, y luego se pasa a la LLM.
Esto permite que el modelo acceda a datos ricos dinámicamente (como transcripciones de entrevistas o historial de respuesta) sin sobrecargar el mensaje.
Ajuste fino
Este enfoque es el más costoso: implica reentrenar el modelo utilizando conjuntos de datos específicos de dominio (por ejemplo, respuestas de miles de usuarios del mismo producto) para adaptarlo a un conjunto de tareas específico. Este proceso puede dar lugar a pesos del modelo interno que se han optimizado para ese dominio en particular.
Como resultado, las respuestas individuales pueden basarse no solo en sus propias acciones pasadas, sino también en las acciones pasadas de individuos con patrones o perspectivas de comportamiento similares en el mismo campo. Por ejemplo, el modelo podría predecir que un amante de los perros en particular se basaría en el hecho de que muchos amantes de los perros en el campo de entrenamiento tienen patios cercados.
¿Pero son efectivos gemelos digitales?
En nuestra evaluación de usuarios sintéticos, no estamos impresionados por el rendimiento actual de los humanos simulados disponibles. Tienden a capturar la naturaleza desordenada y sutil del comportamiento humano real. Los encontramos útiles cuando se veían como herramientas de investigación de escritorio, en lugar de como alternativas para hablar con sus clientes reales.
Hipotéticamente, los gemelos digitales pueden producir resultados más realistas porque se basan en la complejidad sutil de un solo individuo real, en lugar de un resumen, datos promedio que representan grupos.
En el próximo artículo de esta serie, revisaré algunas investigaciones académicas recientes para estudiar las habilidades predictivas de gemelos digitales y usuarios sintéticos; En términos generales, estos estudios muestran muchas esperanzas para los gemelos digitales, especialmente para aplicaciones prácticas como completar los datos faltantes en las encuestas y predecir respuestas de encuestas basadas en entrevistas extensas.
¿Son los gemelos digitales morales?
Los gemelos digitales plantean problemas éticos serios que los investigadores y diseñadores deben ignorar. ¿Cómo se debe gestionar el consentimiento al crear un proxy persistente para los datos duplicados de los participantes? ¿Los usuarios aceptan crear su propia versión digital para completar la encuesta o predecir más comportamientos?
¿Cuáles son los riesgos de declaraciones falsas, especialmente si los gemelos usan más allá del contexto de su intención original? ¿Y cómo nos aseguramos de que el modelo no perpetúe o expanda los sesgos existentes en la recopilación de datos?
Estas preguntas no son solo académicas. A medida que los gemelos digitales pasan de herramientas experimentales a herramientas operativas, depende de la comunidad de UX abordar los problemas de transparencia, privacidad y equidad. Use cuidadosamente, los gemelos digitales pueden complementar los enfoques tradicionales y extender el impacto de la investigación de UX a áreas nuevas, más rápidas y más adaptables, pero solo si somos cautelosos y claros sobre sus limitaciones.
(Tagstotranslate) Twins digitales (T) Usuario de síntesis (T) Generación AI (T) Inteligencia artificial