Alexa встановлюється на понад 100 мільйонів пристроїв по всьому світу, в процесі цього набувають мільярди запитів користувачів. Як і всі цифрові помічники, Alexa покладається на моделі даних, щоб запропонувати кращі відповіді, але схоже, Amazon також надала цифровому помічнику руку допомоги у вигляді людських оглядів. Дослідження Bloomberg показало, що Amazon має глобальну команду, яка переписує та коментує записи Alexa з усього світу, щоб "усунути прогалини в розумінні Алексами людської мови" і дозволить помічнику подати кращі відповіді на ваші запити.
Видання показало, що в Amazon працюють тисячі людей по всьому світу - як підрядники, так і штатні працівники - для перегляду записів Alexa, з командами, розповсюдженими по Бостону, Коста-Ріці, Індії та Румунії. За даними неназваного джерела, кожен рецензент аналізує понад 1000 аудіокліпів протягом дев'ятигодинної зміни, анотуючи їх та передаючи їх назад у систему, щоб покращити відповіді Alexa. З Bloomberg:
Один робітник у Бостоні заявив, що він видобуває накопичені голосові дані для конкретних висловлювань, таких як "Тейлор Свіфт", і анотував їх, щоб вказати, що шукач означав музичного виконавця.
Іноді слухачі підбирають речі, що, власники Ехо, швидше за все, залишаться приватними: жінка, яка погано співає під душем, скажімо, або дитина кричить про допомогу. Команди використовують внутрішні чати для обміну файлами, коли їм потрібна допомога в розборі заплутаного слова - або натрапляють на кумедні записи.
Видання також встановило, що працівники стикаються із записами, які мають тривожний характер:
Іноді вони чують записи, які вважають їх засмучуючими чи, можливо, злочинними. Двоє робітників сказали, що підхопили те, що вони вважають сексуальним нападом. Коли щось подібне трапляється, вони можуть поділитися досвідом у внутрішній чаті як спосіб зняти стрес.
Amazon каже, що для працівників є встановлена процедура, яку слід дотримуватися, коли вони чують щось лихо, але двом працівникам, які базуються в Румунії, сказали, що після запиту вказівок на такі випадки їм сказали, що це не робота Amazon.
У записах немає повного імені або адреси користувача, але вони містять ім’я користувача, номер рахунку та серійний номер пристрою. Амазонка раніше згадувала, що покладається на обробку природними мовами для навчання Alexa, але вона признала Bloomberg, що використовує людський елемент для анотації "невеликого зразка голосових записів Alexa:"
Ми серйозно ставимось до безпеки та конфіденційності особистої інформації наших клієнтів. Ми лише коментуємо надзвичайно малий зразок записів голосу Alexa, щоб покращити якість клієнтів. Наприклад, ця інформація допомагає нам навчити наші системи розпізнавання мовлення та розуміння природних мов, тому Alexa може краще зрозуміти ваші запити та забезпечити, щоб сервіс працював добре для всіх.
Ми маємо суворі технічні та експлуатаційні гарантії та проводимо політику нульової толерантності до зловживань нашою системою. Співробітники не мають прямого доступу до інформації, яка може ідентифікувати особу чи обліковий запис як частину цього робочого процесу. Вся інформація обробляється з високою конфіденційністю, і ми використовуємо багатофакторну автентифікацію для обмеження доступу, шифрування сервісу та аудитів нашого контрольного середовища для її захисту.
Не тільки Amazon звертається до людей-помічників, щоб розробити свого цифрового помічника. Блумберг встановив, що в Apple також є група людей, яка перевіряє, чи відповідає інтерпретація запитів Siri тому, що запитували користувачі. У Google є рецензенти, які готують Assistant, але в кліпах немає жодної особистої інформації, і саме аудіо спотворене, щоб запобігти будь-якій ідентифікації.