信息安全的偽命題:巨頭科技公司正大光明地監(jiān)聽用戶。
在智能音響研發(fā)中,參與者需要用海量音頻內(nèi)容對算法模型進行訓(xùn)練。然而在錄音室中錄制的音頻難以滿足魯棒性要求較高的模型。也許是出于這個原因,亞馬遜Alexa研發(fā)人員被要求使用Alexa設(shè)備上“竊聽”用戶與其對話的內(nèi)容,存儲音頻,并將交給全球各地的標注人員,以助于特定話題下的對話體驗。
Alexa語音系統(tǒng)涵蓋Echo、EchoDot、EchoSpot等智能音箱產(chǎn)品。
據(jù)報道,亞馬遜在全球雇傭數(shù)千名員工來改進Alexa語言系統(tǒng),一份報告表示:“研究小組會監(jiān)聽Echo用戶家中和辦公室里的錄音!薄斑@些錄音會被轉(zhuǎn)錄、注釋,然后反饋回軟件,這是為了消除Alexa對人類語言理解的空白,幫助它更好地響應(yīng)命令。”
知情人士說,這個團隊由第三方承包商和一些全職亞馬遜員工組成,他們在波士頓、哥斯達黎加、印度和羅馬尼亞等地點辦公,并簽署保密協(xié)議,禁止公開談?wù)撛擁椖。他們每天工?個小時,每人每天需要要分析1000個音頻片段。
該項目位于羅馬尼亞首都的辦公地點,沒有任何外部標志顯示亞馬遜的存在。這項工作大多很簡單。波士頓的一名工作人員說,他為“泰勒·斯威夫特”等特定話語挖掘了積累的語音數(shù)據(jù),并對其進行了注釋,以表明搜索者需要的是音樂藝術(shù)家泰勒相關(guān)內(nèi)容。
有時他們聽到令他們不安的錄音,甚至是是犯罪現(xiàn)場的聲音。兩名工人說,他們認為發(fā)現(xiàn)了性侵現(xiàn)場的音頻,類似的音頻被處理時,他們有時會在“群里”分享,以緩解壓力。亞馬遜表示,當員工聽到令人不快的事情時,他們有相應(yīng)的程序可以遵循,但兩名羅馬尼亞員工表示,在要求對此類案件進行處理時,卻被亞馬遜告知無權(quán)干涉。
那么問題來了:監(jiān)聽部門員工若從Alexa聽到小孩子呼救聲、家庭暴力、犯罪等意外聲響,會怎么想?他們會立即作出反應(yīng)來報警么?還是根據(jù)亞馬遜的要求坐視不管?
亞馬遜一位發(fā)言人回復(fù)聲明提到:“亞馬遜嚴肅對待客戶個人信息的安全隱私。為了改善客戶體驗,我們只注釋了一小部分Alexa語音樣本。這些信息會幫助我們訓(xùn)練語音識別和自然語言理解系統(tǒng),因此Alexa才能更好地理解用戶的請求!
他們補充說:“我們有嚴格的技術(shù)和操作保障措施,對濫用我們的系統(tǒng)采取零容忍政策。員工不能直接訪問作為此工作流一部分的個人或帳戶標識信息。所有信息都被高度保密,我們使用多因素身份驗證來限制訪問、服務(wù)加密和審計我們的控制環(huán)境來保護它。”
這個劇情似乎曾經(jīng)演繹過:中國微型芯片竊取數(shù)據(jù)的報道事件。亞馬遜Alexa竊聽“案件”,同樣出自美國媒體“彭博社”之手,前者被曝光為虛假新聞。所以,以至于這則報告的真實性如何,我們還需等待進一步考證。
對此事件,亞馬遜掌門人貝索斯尚未作出回應(yīng)。