上周末在英国的报道(《卫报》)详细提到,苹果雇佣了一名承包商来收听一些Siri音频,这促使批评人士以这个故事为依据,证明苹果对隐私的承诺只不过是营销宣传。《卫报》报道节选:据《卫报》报道,苹果承包商经常听到机密的医疗信息、交易和性伴侣的录音,这是他们提供质量控制或“分级”工作的一部分。这是公司的Siri语音助手。
尽管苹果没有在其面向消费者的私人文件中明确披露,但少量Siri录音将交付给为该公司工作的承包商。
你确定百分之百确定吗?因为我只是看了看分散在整个操作系统中的苹果隐私屏,我可以明确清晰地展示一些Siri录音可以用来改进Siri服务。最重要的是,通过苹果的iOS软件许可协议,我很快找到了以下摘录:
通过使用Siri或听写功能,您同意并同意苹果及其子公司和代理商传输、收集、维护、处理和使用该信息(包括您的语音输入和用户数据),以提供和改进Siri、听写和听写功能。在其他苹果产品和服务中。
整段以粗体显示,我认为这与苹果的意图相当明确。
该公司正在向第三方(负责培训Siri算法的承包商)出售Siri个人助理收集的语音数据的“启示”。如果您一直在关注,它将被用作改进Siri服务的技术的一部分。
就连《卫报》也承认:
他们根据各种因素对回复进行评分,包括语音助手是有意还是无意激活的,查询是否是Siri想要提供的帮助,以及Siri的回复是否合适。
这并不是人们第一次“发现”一些Siri音频剪辑已经交付给第三方。早在2015年,一家名为Walk N'Talk Technologies的公司的匿名员工在Reddit上写道,该公司正在分析的语音数据来自Siri和Cortana等个人助理。
以下是对苹果《卫报》和其他公司的声明:
将分析少量Siri请求,以改进Siri和听写。用户请求与用户的苹果标识无关。Siri的回复是在安全的设施中进行分析的,所有审查人员都有义务遵守苹果严格的保密要求。
103010事件的症结来自“举报者”,基本上是苹果的雇主。他报告说,他在意外激活过程中听到了一些个人物品。
记者对该报说:
记载的例子数不胜数,包括医患私下讨论、商业交易、看似交易、性接触等等。这些记录伴随着显示位置、联系信息和应用数据的用户数据。
用户查询的音频记录使用位置等元数据来更好地理解上下文。令人担忧的是,承包商从一开始就能听到私人谈话。正如报告本身所承认的,这是有可能的,因为用户可能会在没有意识到的情况下,不小心呼叫了Siri,然后提示在服务器上录制唤醒短语“Hey Siri”的语音,这肯定不是因为Siri在没有用户同意的情况下偷偷录制了对话。
我绝对觉得自己和网上其他人不一样。
仅仅依靠人工智能和机器学习的力量,我们不能指望数字助理随着时间的推移而改进。这是因为助手使用的机器学习模型必须首先由人工编辑人员进行训练——对此没有两种方法。
如果该公司不使用真人照片来训练算法,谷歌照片将无法准确识别人脸。如果不训练出100多万张不同面孔的照片,就无法实现苹果的Face ID。即使是像语音识别这样的“普通”事物,也可以通过使用训练有素的数据使用机器学习算法来大大改进。
硬道理是,机器无法训练出其他机器的机器学习模型,取得满意的结果,这是我们人类擅长的。
业内每一个认真研究人工智能的人都会雇佣人工编辑来训练他们的机器学习算法,以提高服务质量。这些员工可以接触到自己工作的核心内容,无论是智能音箱在语音交互时捕捉到的短音频片段,还是人们上传到照片分享服务的照片或社交媒体feeds中标注的项目,你都能看懂。
有些公司比其他公司更注重隐私。在手工编辑如何处理手头任务方面,一些公司可能不如其他公司透明。此外,最终,一些在保护用户隐私方面没有良好记录的公司可能会比其他公司受到媒体和公众更多的审查。
但我一点也不相信,让员工用个人数字助理真正倾听我们的对话对任何公司都有好处,因为他们可以——或者因为他们可能希望以某种方式从这些私人公司获得可操作的信息。对话——摆脱它很多很多年,没有人真正注意到或抱怨任何事情。在今天的网络世界,这是不可能的。
不要误会,我要感谢一些报道这些事情的记者的辛勤工作,因为他们给了隐私十字军一些可啃的东西。然而,我没有在一秒钟内得到他们模棱两可或隐含的结论。
论,即大科技公司不仅在聘用人类编辑人员培训Siri,Alexa和Google Assistant,而且还窃听了我们的对话以进行一些尚待披露的工作,但肯定是邪恶的目的。是的, 因为某些口头请求中包含位置信息,所以一些收听Alexa请求的亚马逊员工确实可以访问用户的家庭住址。是的, 由于用户可以自由地向其数字助理说出他们想要的任何事情,因此,人工审核的某些Google Assistant录音可能包含私人对话。
这些员工被要求处理的录音在一天结束时很重要。这是事实,一些无赖的人工编辑可能会滥用我们应该担心的私人客户信息,而不是人类正在为改善服务的明确目标而在范围广泛的安全设施中收听精选的录音。