语音助手已经成为日常生活中的好帮手,但是你知道不同的公司是如何收集语音数据的吗?

你知道语音助手背后的公司是如何处理你的语音数据吗?

熟悉Alexa、Cortana、Google Assistant、Bixby或Siri吗?每天都有数亿人使用由亚马逊、微软、谷歌、三星或苹果开发的语音助手,而且使用人数还在不断增长。

据最近进行的一项调查显示,每月有9010万美国成年人在智能手机上使用语音助手,7700万人在汽车上使用,4570万人在智能扬声器上使用。然而许多用户可能没有意识到他们的语音记录不会被立即删除。相反,它们可能会被存储多年,某些记录甚至会由审阅人员进行人工分析。

亚马逊
亚马逊表示,为了改善客户体验,只对非常小的语音记录样本进行分析。例如会训练语音识别和自然语言理解系统,以便Alexa能更好地理解用户请求。亚马逊雇佣了第三方承包商来审查这些录音,但亚马逊表示,公司有严格的技术和操作保障措施以防止记录被滥用,而且这些员工无法直接获得识别信息(只有账号、名字和设备序列号)。“所有个人信息都被高度保密,我们使用多因素认证来限制访问、加密服务和审计控制环境。”

在web和app设置页面中,亚马逊为用户提供了禁用语音录制功能的选项。不过,该公司表示,在定期审查的过程中,选择禁用的用户的录音可能还是会被人工分析。

苹果
苹果在其隐私页面讨论了Siri录制音频的审核过程。苹果解释说,出于更好地开发和保证质量,只对Siri数据的一小部分进行了“评分”,并对其进行了标注,每个评分者都会根据音频质量进行分类,并指出正确的操作。这些标签有助于持续提高Siri识别系统的质量。

另外,供审查的录音都是加密和匿名的,与用户的姓名或身份等个人信息无关。审阅人员不会收到用户设备的标识符。这些语音记录会被保存6个月,在此期间,Siri的识别系统会对这些录音进行分析,以“更好地理解”用户的声音。六个月后,这些没有标识符的录音也继续将被保存下来,用于改进和开发Siri,最长可保存两年。

谷歌
谷歌的一位发言人称,谷歌只进行非常有限的音频转录,以改进语音识别系统,并且应用了广泛的技术来保护用户个人信息。谷歌审核的音频片段与任何可识别的个人信息都没有关联,而且转录基本上是自动的,不由谷歌员工处理。此外,在使用第三方服务来审查数据的情况下,谷歌通常提供文本,不提供音频。

谷歌会无限期地存储Google Assistant录制的音频片段。但是,谷歌与亚马逊和苹果一样,允许用户永久删除这些录音,并选择不参与未来的数据收集。尽管如此,谷歌在其隐私政策中表示,可能保留与服务相关的信息,以防止垃圾邮件和滥用,并改善服务。

微软
微软的一位代表表示,微软的支持页面中概述了微软在Cortana方面的隐私做法。微软收集语音数据是为了加强Cortana对个人用户语音模式的理解,不断改进Cortana的识别和响应,以及改进其他使用语音识别和理解的产品和服务。

但是还不清楚是由微软员工还是第三方承包商进行人工审查,以及数据是如何匿名的。但该公司表示,只有启用了“Hey Cortana”功能的电脑,Cortana才会收集语音。微软允许用户通过访问Windows 10中的控制面板或搜索页面来选择退出语音识别。