尽管虚拟助理仍然很受欢迎,但许多人担心,拥有能够监控从公司工作区到家庭客厅的对话的设备会带来隐私风险。在一份关于亚马逊Alexa如何工作的报告之后,谷歌似乎使用了几乎相同的过程来改进算法。
VRTNWS比利时公共广播公司发布了一份报告,揭示了如何收听通过谷歌助手录制的1000多段摘录,然后人们面对他们的录音,这是电视台发现的,因为音频剪辑中出现了地址和其他敏感信息。
比利时和荷兰的人听到自己或近亲的声音都会感到震惊。“不可否认,这是我自己的声音,”一名男子说,而一对夫妇很快就能认出他们的儿子和孙子的声音。
“谷歌为什么存储这些录音,员工为什么要听这些录音?”他们对你说的话不感兴趣,而是对你说话的方式感兴趣。谷歌的计算机系统由智能自学习算法组成。VRTNWS补充说,谷歌使用其在线工具众包来防止搜索引擎在分析语音命令时遇到困难。
尽管任何人都可以免费使用该工具,帮助谷歌更好地描述图像和面部表情,但音频记录只能由谷歌的分包商访问,他们可以登录该工具的安全部分,音频摘录列表正在等待他们的分析。VRTNWS说,他们有三个来源可以证实谷歌是这样运作的。“通过谷歌家庭智能音箱制作的大部分录音都非常清晰。用智能手机应用程序谷歌助手录制的录音具有通话质量。但声音没有受到任何扭曲。”
虽然用户信息会从音频摘录中删除,使其匿名,但录音本身使人们很容易知道某人的身份,并且还可以通过分包商在谷歌或脸书上找到的地址或公司名称来跟踪这些人。该出版物还发布了一则视频报道,称在他们听到的1000个摘录中,有153个是错误录制的,这意味着“ok Google”的命令没有发出。其中包括“卧室对话、父母和孩子之间的对话,以及激烈的争吵和包含大量个人信息的专业电话。”
一名转录此类音频片段的员工也告诉他,他能识别的一名女性处于“确定的压力”之下,但鉴于在这种情况下缺乏指导原则,他无能为力。虽然条例确实规定账号和密码必须标记为敏感信息。这些录音还表明,男性对色情电影有很大的需求,即使是通过智能扬声器,尽管这本身并不是一个完全的启示。
谷歌应该做出回应,承认这是语言专家帮助提高语音技术的一种方式。“这是通过制作少量音频文件的文本来实现的,”该公司的比利时发言人说,并补充说,“这项工作对于开发支持谷歌助手等产品的技术非常重要。”
谷歌还声称,其语言专家仅判断了约0.2%的音频片段,这些音频片段与任何个人或可识别信息无关。考虑到VRTNWS可以用自己的录音面对人们,实际情况可能会大不相同。