据彭博社(Bloomberg)报道,亚马逊雇佣了数千名员工来监听世界各地的人们对他们的Alexa数字助手说了些什么。该报道援引了参与该项目的七名人士的话。
而他们的工作是“改善”Alexa,团队“听Echo音箱主人在家里和办公室里被录到的声音”,然后转录、标注和反馈到软件里,这是为了让Alexa更成功地理解人类语言交互。
换句话说,人类正在有效地帮助训练亚马逊的算法。
在营销材料中,亚马逊称Alexa“生活在云端,而且一直在变得更聪明”。
但是,就像许多为从经验中学习而构建的软件工具一样,人类也是进行教学的一部分。
聆听团队由来自世界各地的兼职合同工和全职亚马逊员工组成,包括印度、罗马尼亚、波士顿和哥斯达黎加。
亚马逊布加勒斯特办公室位于罗马尼亚首都Globalworth大厦的最高三层,据该办公室的两名员工介绍,这些倾听团队的员工每天工作9小时,每个人每班要审阅多达1000段音频剪辑。
这个位置在Pipera区“摇摇欲坠的基础设施中脱颖而出”,而且“没有任何亚马逊存在的外部标志”。
尽管大部分工作都很无聊(一名工作人员说,他的工作是为诸如“泰勒•斯威夫特”(Taylor Swift)这样的特定短语挖掘积累的语音数据——让系统知道搜索者在寻找这位艺术家),但评论者也在倾听人们最私密的时刻。
偶尔,听众会听到Echo的主人可能更愿意保持隐私的东西:比如,一个女人在淋浴时唱歌唱得很糟糕,或者一个孩子大声呼救。
据彭博社报道,当团队需要帮助解析一个混乱的单词或遇到一段有趣的录音时,他们会使用内部聊天室来共享文件。
偶尔,亚马逊的听众会遇到令人不安或可能是犯罪的录音,比如两名员工说他们偷听了一段听起来像是性侵犯的录音。
据报道,当这样的事情发生时,员工们会在内部聊天室里提起这件事,以“缓解压力”。
尽管亚马逊表示,当员工听到令人痛苦的事情时,它有程序可循,但两名驻罗马尼亚的员工表示,当他们就此类事件请求指导时,他们被告知“亚马逊无权干涉”。
亚马逊发言人在一份提供给彭博社的声明中表示:“我们严肃对待客户个人信息的安全和隐私。”
“为了改善客户体验,我们只标注了一小部分Alexa语音录音样本。例如,这些信息帮助我们训练我们的语音识别和自然语言理解系统,这样Alexa就能更好地理解你的请求,并确保这项服务对每个人都有效。”
“我们有严格的技术和操作保障措施,对滥用我们的系统采取零容忍政策。员工不能直接访问作为此工作流一部分的个人或帐户标识信息。所有信息都被高度保密,我们使用多因素身份验证来限制访问、服务加密和审计我们的控制环境来保护它。”
尽管如此,亚马逊并没有提到人类正在听Alexa收集的一些对话录音。
相反,他们在FAQ中有一个一般性的免责声明,说“我们使用您对Alexa的请求来训练我们的语音识别和自然语言理解系统。”
据CNBC财经频道去年11月的报道,根据亚马逊的Alexa使用条款,该公司收集和存储了你对Alexa说的大部分内容,包括产品的地理位置和语音指令。