Saltar enlaces

Fatiga documental causada por la inteligencia artificial: cómo diseñé una forma de deshacerme de ella

La inteligencia artificial nos ha supuesto una revolución en el ocio, pero también nos ha dado más documentos para consumir. Diseñé una aplicación basada en la voz para trasladar mi trabajo desde mi escritorio a un espacio que funcione para mí.

Un hombre sentado en un banco habla con la aplicación ARC para proporcionar comentarios sobre documentos
Proporcione comentarios sobre documentos desde su escritorio con ARC (Message Review Companion). Imágenes generadas por IA.

falsa promesa

La inteligencia artificial generativa cambiará para siempre la forma en que vivimos y trabajamos. Tendremos más tiempo para hacer un trabajo interesante, profundo y significativo. No necesitamos escribir esos tediosos correos electrónicos y mensajes de Slack porque la IA generará borradores instantáneamente o, mejor aún, su agente personal lo hará de manera proactiva en su nombre. En los últimos años, durante la adopción masiva de la inteligencia artificial generativa, los titulares hablaban de que estábamos en la cúspide de una revolución que nos permitiría tener más tiempo libre y subcontratar trabajos tediosos, lo que nos permitiría centrarnos una vez más en trabajos significativos. Los directores ejecutivos de las grandes empresas tecnológicas predicen que en aproximadamente una década nunca tendremos que lidiar con El trabajo se convierte en un hobby opcional.

Luego, la realidad se impone y el surgimiento de la inteligencia artificial en la fuerza laboral se vuelve supernova: los despidos masivos regulares se convierten en la norma, se espera que todos asuman más responsabilidades y los diseñadores deben completar prácticamente todo el alcance del ciclo de vida del producto.5x según metadatos. La carrera hacia el abismo ha comenzado, e incluso la apariencia de salud corporativa ha sido desechada por la ventana. A medida que surgen nuevas herramientas, procesos y métodos de optimización de IA, el trabajo se convierte rápidamente en un maratón que provoca ansiedad, y la meta se retrasa cada semana.

Problemas de salud mental causados ​​por El estrés y la ansiedad relacionados con el trabajo siguen aumentando A una velocidad asombrosa. Con la inseguridad laboral, el miedo y la ansiedad se han convertido en el estado predeterminado en el lugar de trabajo, y los empleados se sienten abrumados por el gran volumen de trabajo que asumen. Incluso para las decisiones y el trabajo menos agitado, consumir y digerir grandes cantidades de información para tomar esas decisiones conlleva un alto riesgo de fatiga mental y agotamiento.

¿Fatiga en la revisión de documentos?

Irónicamente, como diseñador, ahora tengo más documentación escrita con IA para revisar, comentar y luego mejorar para tomar decisiones comerciales y de productos.

La bandeja de entrada está llena de solicitudes para revisar documentos.
Una gran cantidad de solicitudes entrantes de documentos de revisión. Imágenes generadas por IA.

Estos documentos suelen ser bastante aburridos, lo que significa que leerlos puede resultar una tarea ardua. A veces utilizo herramientas como NotebookLM para generar resúmenes y extraer documentos complejos de formato largo. Pero para llegar al meollo de algunos de ellos, necesitaba leerlos palabra por palabra y comentarlos para comprender realmente los conceptos sutiles y establecer instrucciones claras para seguir refinando.

El problema está aquí. Realmente no me gusta mirar una pantalla todos los días y leer documentos llamativos. A veces los cargo en mi iPad y me siento afuera, lo cual es un cambio bienvenido desde mi escritorio, pero mi vista todavía está bloqueada en la pantalla. O imprimirlos y luego escribir comentarios a mano, lo que crea la molestia adicional de reabsorber y revisar mis garabatos para convertirlos en acciones significativas.

“Para llegar al núcleo de algunos de estos documentos, necesito leerlos palabra por palabra… los resúmenes no son suficientes”.

Toma nota de esta nota…

Sólo entonces me di cuenta de por qué no puedo escuchar estos archivos. Mejor aún, mientras escuchas, envía mis comentarios directamente al Asistente, que puede registrar mis comentarios en Google Docs. Luego puedo pedirle a un agente como Claude Cowork que realice más mejoras basándose en estos comentarios. Al no tener que sentarme a leer puedo hacerlo mientras camino o incluso mientras preparo una comida.

Lo que quiero es simple: tomar un documento de Google y que me lo lean palabra por palabra, con la posibilidad de detenerlo en cualquier momento mediante un comando de voz y publicar comentarios agregados al documento. Yo también quiero…

  • No es necesario que se siente en su escritorio mientras revisa.
  • No es necesario mirar la pantalla para operar.
  • Libera mis manos para que pueda elegir realizar otras tareas.

He investigado aplicaciones de voz como Speechify y Wisperflow, pero no eran lo suficientemente maduras a la hora de agregar comentarios a Google Docs a través de conversaciones. NotebookLM solo hace resúmenes y no puede proporcionar comentarios en forma de un único asistente de conversación. Mientras desarrollaba esta aplicación, Google había anunciado recientemente capacidades de lectura y edición de voz en Google Docs en la conferencia Google I/O ’26, pero no había ninguna función de comentarios de voz que estuviera buscando.

Realmente sentí que había una oportunidad de explorar algunas soluciones interesantes a este problema. Pasé tiempo probando la interfaz multimodal y publiqué Thia, socio de pizarra de ideas de código abierto multimodalCreo que puedo crear con relativa rapidez una aplicación que pueda ser mi lector y receptor de comentarios usando Gemini Flash Live en AI Studio.

¿Qué fue primero, los modelos o los procesos?

Prueba: ¿qué se debe construir primero, el modelo subyacente o el proceso? En este caso, los construí en paralelo. Entonces, después de un poco de pizarra para descubrir el concepto de diseño y un documento de requisitos del producto relativamente conciso, construí tanto el modelo como el proceso: la aplicación subyacente en Google AI Studio y el sistema de diseño y diseño de pantalla en Claude Design. Tengo dos ventanas gráficas una al lado de la otra y cambio entre ellas para no perder el tiempo esperando el modelo. Luego proporcioné el design.md generado por Claude, capturas de pantalla y algunas implementaciones de animación específicas como contexto para que Gemini 3.1 Pro se integrara en la aplicación.

Capturas de pantalla lado a lado de Claude y AI Studio durante el desarrollo
Construya y diseñe ARC utilizando Claude Design y AI Studio

Esta es la primera vez que uso Claude Designs en un proyecto de Angry. Lo encontré relativamente capaz de producir imágenes más allá del concepto de diseño, pero sin una dirección muy clara puede generar inconsistencias, y el límite de tokens del plan Pro está lejos de ser generoso.

Después de algunas rondas de indicaciones en pantalla dividida, mi aplicación de lectura/revisión manos libres Audio Review Companion – ARC estaba lista para la prueba. Para mí es muy importante que la interacción conversacional se sienta como si estuviera hablando con un asistente que puede tomar notas mientras hablo, así que configuré Gemini Flash Live para priorizar la velocidad para actuaciones rápidas.

Una de las grandes ventajas de utilizar un único modelo para leer y navegar es que es como hablar con alguien que entiende el documento y al mismo tiempo actúa como guía. Puedo guiar al ARC con comentarios como “Empiece a leer la Parte 2” o “Vaya a la sección Análisis competitivo”. Realmente encuentro esta aplicación liberadora porque me aleja de mi flujo de trabajo de escritorio tradicional.

Flujos de pantalla en aplicaciones ARC
Estado de la aplicación ARC desde la carga del archivo hasta la revisión de comentarios

Herramientas como ARC pueden empezar a parecer menos experimentos y más modelos iniciales de cómo trabajamos realmente. La industria se está desarrollando en esta dirección: Nvidia lanzó recientemente chips de inteligencia artificial para portátiles que ejecutan modelos localmente.

“Usar un único modelo para leer y navegar significa que es como hablar con alguien que entiende el documento y al mismo tiempo actúa como guía”.

Construir según mis términos

La revelación más sorprendente de esta compilación fue cómo seguí perfeccionando la experiencia de la aplicación. Inesperadamente, hice muchos cambios en el acto. Quiero decir, sigo usando la aplicación en diferentes entornos, desde caminar hasta hacer jardinería. Cuando tuve un problema, primero creé el mensaje en mi teléfono y luego volví a probar la aplicación actualizada in situ, lo cual fue una experiencia verdaderamente nueva en el desarrollo de mi flujo de trabajo, puliendo la aplicación mientras eliminaba.

Consejos para ARC durante la jardinería
Modifique la aplicación en el campo durante las pruebas de campo (mientras trabaja en el jardín). Imágenes generadas por IA.

Existen algunas limitaciones al utilizar AI Studio de Google. Dado que está basada en un navegador y no en una aplicación nativa, no se ejecuta en segundo plano en mi iPhone, lo que significa que la pantalla debe estar encendida. La API de comentarios de Google Docs es muy limitada y no me permite insertar y anclar comentarios específicamente en secciones resaltadas, por lo que los comentarios tienen el prefijo del nombre de la sección del contexto, pero considerando que la mayoría de mis comentarios son para inteligencia artificial, esto no es un gran problema. Sin embargo, una ventaja es que creé la mayor parte de la aplicación utilizando mi asignación de tokens gratuitos.

establecer límites

el último Un estudio de HBR encuentra que la IA mejorará los empleos, no los reducirá; A medida que la inteligencia artificial se vuelve omnipresente y fácilmente accesible, las personas sacan más trabajo de sus horas de trabajo. a pesar de I He estado usando ARC para tomarme un tiempo fuera de mi escritorio y me di cuenta de que una herramienta como esta puede ser un arma de doble filo. Si se implementan en el entorno equivocado, pueden fácilmente invadir el sagrado tiempo de inactividad personal.

Veo este problema de dos maneras diferentes. Si ya estoy en el trabajo, elegir revisar un documento mientras camino a la tienda es un bienvenido descanso de la pantalla. Es trabajo, pero en mis términos. Por otro lado, dar un paseo consciente y luego decidir dedicar algo de trabajo se siente como una intrusión directa en mi tiempo libre personal. Construí ARC específicamente para soportar el primer escenario. da I flexibilidad de procesamiento mío Trabajar, mío De esta manera, me aseguro de no tener que trabajar durante mi tiempo libre. Lo mejor de todo es que puedo pasar más tiempo al aire libre y sentirme realmente liberado después de meses de estar frente a la pantalla.

“Si ya estoy en el trabajo, elegir revisar documentos mientras camino a la tienda es un bienvenido descanso. Es trabajo, pero bajo mis términos”.

El mundo está cambiando rápidamente. O estamos a merced de estos sistemas o los utilizamos para restaurar la forma en que trabajamos. Diseñemos y construyamos cosas que nos ayuden a trabajar como queremos.

Prueba ARCO

Pruebe la aplicación ARC y úsela en el trabajo. No Durante su tiempo de inactividad.

https://medium.com/media/e03ee9481b06b1dc3fe2c31f46deb499/href

La versión 1 de ARC se creó para resolver mi problema específico, pero sabía que la experiencia del usuario y las comunidades de ingenieros podían ir más allá. Abrí el repositorio en GitHub y también puedes mezclarlo en Google AI Studio. Si tiene una idea para mejorar la experiencia de voz, una mejor navegación con manos libres de elementos complejos o una forma de superar las limitaciones de la API de Google Docs, envíe una solicitud de extracción o inicie una discusión en el repositorio.

notas: Para ver sus propios Google Docs, debe otorgar permiso a la aplicación para acceder a ellos; la forma más sencilla es mezclarlos en Google AI Studio, ya que todo se ejecuta en su propio espacio. Si desea probar esta función primero sin conectar su propio documento, utilice el documento de muestra proporcionado para ver cómo funciona.

Lecturas relacionadas y adicionales


Fatiga documental causada por la inteligencia artificial: cómo diseñé una forma de deshacerme de ella Publicado originalmente en colectivo de experiencia de usuario En Medium, la gente continúa la conversación destacando y respondiendo a esta historia.

Home
Account
Cart
Search
¡Hola! ¡Pregúntame lo que quieras!
Explore
Drag