Miles de trabajadores de Amazon escuchan lo que sus usuarios le dicen a Alexa
jueves, 11 de abril de 2019
El equipo humano interviene para mejorar el sistema y ampliar el vocabulario del sistema
Bloomberg
Decenas de millones de personas usan altavoces inteligentes y su software de voz para jugar, escuchar música o encontrar la respuesta a trivialidades. Otros millones se resisten a introducir los poderosos altavoces en sus hogares ante el temor de que alguien pueda estar escuchando.
Y a veces, alguien lo está...
Amazon.com Inc. emplea a miles de personas en todo el mundo para ayudar a mejorar el asistente digital Alexa que opera su altavoz Echo. El equipo escucha las grabaciones de voz capturadas en casas y oficinas de los propietarios de Echo. Las grabaciones se transcriben, se anotan y luego se vuelven a alimentar al software como parte de un esfuerzo por eliminar las limitaciones de comprensión del lenguaje humano de Alexa y facilitar una mejor respuesta a las órdenes.
El proceso de revisión de voz de Alexa, descrito por siete personas que han trabajado en el programa, pone de relieve la participación humana que a menudo se pasa por alto en la formación de algoritmos de software. En los materiales de marketing, Amazon dice que Alexa "vive en la nube y se vuelve más inteligente continuamente". Pero al igual que muchas herramientas de software creadas para aprender de la experiencia, los humanos participan en esa enseñanza.
El equipo está compuesto por un conjunto de contratistas y empleados a tiempo completo de Amazon que trabajan en localizaciones como Boston, Costa Rica, India y Rumania, según las personas, que firmaron acuerdos de confidencialidad, los cuales les impiden hablar públicamente sobre el programa. Trabajan nueve horas al día, y cada revisor analiza hasta 1.000 clips de audio por turno, según dos trabajadores de la oficina de Amazon en Bucarest, que ocupa los tres pisos superiores del edificio Globalworth en el vibrante barrio Pipera de la capital rumana. Las modernas instalaciones destacan en medio de una deteriorada infraestructura, aunque no tienen letreros exteriores que anuncien la presencia de Amazon.
El trabajo es sobre todo mundano. Un empleado de Boston dijo que extrajo datos de voz acumulados de expresiones específicas como "Taylor Swift" y los anotó para indicar que el buscador se refería a la artista musical. En ocasiones, los empleados escuchan cosas que los propietarios de Echo probablemente preferirían que quedara en privado: una mujer que canta mal en la ducha, por ejemplo, o un niño que grita pidiendo ayuda. Los equipos utilizan salas de chat internas para compartir archivos cuando necesitan ayuda para analizar una palabra confusa, o cuando encuentran una grabación divertida...
A veces escuchan grabaciones que encuentran molestas, o con contenido posiblemente delictivo. Dos de los trabajadores dijeron que recogieron lo que creen que fue un asalto sexual. Cuando sucede algo así, pueden compartir la experiencia en la sala de chat interna como forma de aliviar el estrés. Amazon dice que hay procedimientos establecidos si los empleados oyen algo perturbador, pero dos empleados con sede en Rumania dijeron que, después de solicitar orientación para tales casos, se les dijo que no era el trabajo de Amazon intervenir en estas situaciones.
"Nos tomamos en serio la seguridad y privacidad de la información personal de nuestros clientes", dijo un portavoz de Amazon en un comunicado enviado por correo electrónico. “Solo anotamos una muestra extremadamente pequeña de las grabaciones de voz de Alexa para mejorar la experiencia del cliente. Por ejemplo, esta información nos ayuda a capacitar a nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural, para que Alexa pueda comprender mejor sus solicitudes y garantizar que el servicio funcione bien para todos".
“Tenemos estrictas garantías técnicas y operativas, y tenemos una política de tolerancia cero en abuso de nuestro sistema. Los empleados no tienen acceso directo a la información que puede identificar a la persona o cuenta como parte de este flujo de trabajo".
En su información sobre política de privacidad y marketing, Amazon no dice explícitamente que los humanos escuchan las grabaciones de algunas conversaciones recogidas por Alexa. "Usamos sus solicitudes a Alexa para formar a nuestros sistemas en reconocimiento de voz y comprensión del lenguaje natural", dice la compañía en una lista de preguntas frecuentes.
En la configuración de privacidad de Alexa, la empresa ofrece a los usuarios la opción de desactivar el uso de sus grabaciones de voz para el desarrollo de nuevas funciones. Una captura de pantalla revisada por Bloomberg muestra que las grabaciones enviadas a los auditores de Alexa no proporcionan el nombre completo y la dirección de un usuario, sino que están asociadas con un número de cuenta, así como con el nombre de pila del usuario y el número de serie del dispositivo.
"Uno no piensa necesariamente que otro ser humano está escuchando lo que le dice al altavoz inteligente en la intimidad de su hogar", dijo Florian Schaub, profesor de la Universidad de Michigan que estudia temas de privacidad relacionados con estos dispositivos. "Creo que nos han condicionado a la [suposición] de que estas máquinas hacen un aprendizaje de máquina mágico. Pero el hecho es que todavía hay parte de procesamiento manual".
En los hogares de todo el mundo, los propietarios de Echo especulan con frecuencia acerca de quién podría estar escuchando, dicen dos de los revisores, “¿Trabajas para la NSA?”, preguntan en referencia a la Agencia de Seguridad Nacional de Estados Unidos. "Alexa, ¿nos está escuchando alguien más?"