当前位置:安全企业动态 → 正文

苹果的差分隐私对你的数据意味着什么?

责任编辑:editor006 作者:造就 |来源:企业网D1Net  2016-06-25 21:42:57 本文摘自:百度百家

苹果正在加紧向人工智能领域发起冲击,以赶上竞争对手的步伐。此前,其他企业一直在机器学习AI的高速公路上全速前进,这得益于它们挖掘起用户数据来毫不手软。

苹果则不然,在一大群对数据如饥似渴的企业之中,苹果独以用户数据守卫者的角色自居。当其他数据“吸血鬼”们悄悄上传位置信息、键盘行为和搜索词条的时候,苹果对用户信息不闻不问,还不断推出新的硬件解决方案,让自己(以及黑客、政府和身份信息盗用者)无从访问用户数据,而且,其数据分析历来都限制在用户设备上,不会上传到苹果服务器。

但iOS中有几道绕不过去的坎,苹果需要知晓用户行为,才能对特定功能进行精细的调整,对于一家将隐私放在第一位的公司,问题就出现了。差分隐私(differential privacy)的概念由此登场。在近日召开的全球开发者大会(WWDC)上,苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)就此作了简要的讨论。

“差分隐私是统计和数据分析领域的一个研究课题,指使用散列、子采样和噪声注入等方式,在每个用户的信息仍然完全保密的情况下,使众包形式的学习成为可能,”费德里吉解释说。

差分隐私并非苹果首创;学术界多年前就开始研究这一概念。但随着iOS 10的逐步推出,苹果将开始使用差分隐私来收集并分析来自键盘、Spotlight和Notes的用户数据。

差分隐私的原理是用算法加扰个人用户数据,使之无法回溯到个人,然后对数据进行批量分析,得出大规模的趋势规律。其目标是保护用户身份信息和数据细节,同时提取机器学习所需的通用信息。

重要的是,iOS 10会先对单个用户的数据进行随机化处理,再将设备数据集体发送给苹果公司,保证任何时候都不会以不安全的格式传输。苹果也不会收集用户键入的每一个单词或搜索关键字——该公司表示,对于从每个用户那里获取的数据量,它会设置一个上限。

颇不寻常的是,苹果公司还将其差分隐私执行文件交给宾夕法尼亚大学教授亚伦·罗斯(Aaron Roth),接受同行评审。这位计算机科学教授是差分隐私领域的权威人士,著有《差分隐私的算法基础》一书。费德里吉说,罗斯用“开创性”一词评价了苹果在差分隐私方面的工作。

苹果表示,它可能会在iOS 10发布之前,发布差分隐私实施政策和数据保留政策方面的更多细节。

那么,这一切对你来说意味着什么呢?

键盘

在WWDC主旨演讲中,苹果宣布了iMessage的重大改进。差分隐私是这些改进的一大组成部分,因为苹果希望收集数据,用以改进QuickType和表情符号键盘的建议功能。在iOS 9中,QuickType在用户的个人设备上学习短语并更新字典——新词输入达到一定次数以后,自动更正就会停止修改动作。

但在iOS 10中,苹果将使用差分隐私,识别数十亿用户的用语趋势——因此,你可能会惊奇地发现,键盘给出的建议是你从未使用过的某个俚语。

“当然,让软件更加智能的重要工具之一,就是在众多用户之中发现使用规律,”费德里吉解释说。“比如,找出时下流行的新词,使QuickType键盘对新词信手拈来。”

差分隐私也一劳永逸地解决了常用表情符号之争,给表情符号键盘重新排序,爱心符号再也不会藏在散乱的星座符号和鸢尾花之间了。

Spotlight

在此之前,iOS 9为改进Spotlight搜索功能,引入了深度链接(deep linking)。费德里吉在去年的WWDC上揭晓了深度链接,他在演示中用Spotlight搜索了“土豆”,出现的是设备上其他应用中的菜谱,而不仅仅是网页搜索结果。

如今,被孤立在应用程序之中的信息越来越多,超越了传统搜索引擎的覆盖范围,为了这些内容变得可搜索,深度链接就成为必须。然而iOS 9该如何对深度链接的搜索结果进行排名,以防止不相关的建议泛滥Spotlight,这方面依然存在问题。

苹果计划使用差分隐私来解决这个问题。凭借被扰乱的用户数据,苹果可以将极受欢迎的深度链接识别出来,并分配以较高的排名——故而当你用Spotlight查找土豆食谱时,你会得到像Yummly这样的应用提供的最美味的土豆食谱。

Notes

iOS 10用差分隐私来加以改进的最后一项功能是Notes。

在主旨演讲中,费德里吉还讨论了Notes的改进。在iOS 10中,Notes将变得更具互动性,可操作信息将着重显示——打个比方,如果你在Notes中记下一位朋友的生日,它可能会着重显示该日期,建议你创建日历事件以得到提醒。

为提供此类智能建议,苹果需要知道用户普遍喜欢记录何种笔记,而这就要用到差分隐私。

工作原理

那么,差分隐私究竟是什么?它不是一种单一技术,宾夕法尼亚州立大学计算机科学与工程系副教授亚当·斯密(Computer Science)说,他与罗斯一道,从事这方面的研究已有十多年。

它其实是一种数据处理方式,在数据中加入限制,防止通过数据联系到具体个人。它允许你对数据进行总体分析,但会在提取自单独设备的数据中注入噪声,让数据在接受批量处理的同时,不至于危及个人隐私。

“严格来说,这是一个数学定义。它限制了你处理数据的方式,在数据集里面间隔取点的时候,任何点都不会链向太多信息,”史密斯说。

他用没有调准的电台打了个比方,差分隐私就好比在一层静态噪声之下,听到背后的旋律。“一旦你知道自己在听什么,忽略静态噪声就很容易了。你了解不到什么个人信息,但可以看到比较清晰的整体规律。

“如果对自己不加约束,不插入这些噪声,得到的规律还会更加清晰、准确。但为了更有力地保障用户隐私,这是必须作出的牺牲,”史密斯说。

史密斯认为,苹果是第一家尝试大规模采用差分隐私的公司,尽管他也承认,其他大型商业实体(如AT&T)也曾做过这方面的研究(可能让人意想不到的是,谷歌也通过Rappor项目做过这方面的研究)。他指出,初创企业也表现出了兴趣。

虽然除苹果之外,没有其他商业实体大规模部署差分隐私,但史密斯表示,这一概念的稳妥性是毋庸置疑的,不过他指出,实施也要得当才行。

“与任何事关安全性的技术一样,魔鬼就在细节间。落实必须非常妥善。但背后思路是非常稳妥的,这一点没有争议。”

AI的未来将受何影响?

史密斯说,苹果公司采用差分隐私是AI领域的一件大事,差分隐私或能给机器学习技术发挥作用的方式带来翻天覆地的变化。

在硅谷,隐私之争往往以执法视角呈现,体现为用户与美国国家安全之争。但在科技企业,隐私之争就成了用户隐私与功能之间的取舍。苹果引入差分隐私,可能会从根本上改变这场辩论。

谷歌和Facebook就一直困扰于这个问题:如何提供功能丰富同时又保护隐私的产品。谷歌的最新消息应用Allo以及Facebook的Messenger都不将端到端加密设为默认,因为两家公司都需要大量用户对话来提升机器学习,使聊天机器人运转起来。苹果也想从用户数据中获取深入的信息,但它不愿让端到端加密的iMessage开倒车。

史密斯说,苹果选择差分隐私,将使企业重新权衡保护隐私与改进机器学习之间的取舍。“我们现在收集那么多数据,但真正需要的根本没那么多,”史密斯说。“这类技术绝对是隐私保护的另一条出路。”

虽然iOS 10只会用差分隐私来改进键盘、深度链接及Notes,但史密斯指出,如果试水成功,苹果可能将此策略延伸到地图、语音识别等功能。史密斯说,苹果还可以看看人们在一天中哪些时段使用哪些应用。

苹果不收集原始用户数据,或能提升用户对它的信赖,同时在政府面前,苹果也可以展现出更加强硬的立场——在近期与FBI的官司大战之中,苹果就为了用户隐私据理力争。

由于差分隐私研究已有十年的积淀,它对苹果来说是个相对低风险的安全策略。史密斯表示,这个概念找到了创新和用户安全之间的“最佳位置”。

“无论苹果的成功是否彻底,这都将彻底改变隐私对话,”史密斯说。“我认为,人们对私人信息收集的看法将因此改变。这可能是苹果公司这一项目的最大遗产,也许会远远超出它对苹果业绩的影响。”

关键字:苹果可能谷歌

本文摘自:百度百家

x 苹果的差分隐私对你的数据意味着什么? 扫一扫
分享本文到朋友圈
当前位置:安全企业动态 → 正文

苹果的差分隐私对你的数据意味着什么?

责任编辑:editor006 作者:造就 |来源:企业网D1Net  2016-06-25 21:42:57 本文摘自:百度百家

苹果正在加紧向人工智能领域发起冲击,以赶上竞争对手的步伐。此前,其他企业一直在机器学习AI的高速公路上全速前进,这得益于它们挖掘起用户数据来毫不手软。

苹果则不然,在一大群对数据如饥似渴的企业之中,苹果独以用户数据守卫者的角色自居。当其他数据“吸血鬼”们悄悄上传位置信息、键盘行为和搜索词条的时候,苹果对用户信息不闻不问,还不断推出新的硬件解决方案,让自己(以及黑客、政府和身份信息盗用者)无从访问用户数据,而且,其数据分析历来都限制在用户设备上,不会上传到苹果服务器。

但iOS中有几道绕不过去的坎,苹果需要知晓用户行为,才能对特定功能进行精细的调整,对于一家将隐私放在第一位的公司,问题就出现了。差分隐私(differential privacy)的概念由此登场。在近日召开的全球开发者大会(WWDC)上,苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)就此作了简要的讨论。

“差分隐私是统计和数据分析领域的一个研究课题,指使用散列、子采样和噪声注入等方式,在每个用户的信息仍然完全保密的情况下,使众包形式的学习成为可能,”费德里吉解释说。

差分隐私并非苹果首创;学术界多年前就开始研究这一概念。但随着iOS 10的逐步推出,苹果将开始使用差分隐私来收集并分析来自键盘、Spotlight和Notes的用户数据。

差分隐私的原理是用算法加扰个人用户数据,使之无法回溯到个人,然后对数据进行批量分析,得出大规模的趋势规律。其目标是保护用户身份信息和数据细节,同时提取机器学习所需的通用信息。

重要的是,iOS 10会先对单个用户的数据进行随机化处理,再将设备数据集体发送给苹果公司,保证任何时候都不会以不安全的格式传输。苹果也不会收集用户键入的每一个单词或搜索关键字——该公司表示,对于从每个用户那里获取的数据量,它会设置一个上限。

颇不寻常的是,苹果公司还将其差分隐私执行文件交给宾夕法尼亚大学教授亚伦·罗斯(Aaron Roth),接受同行评审。这位计算机科学教授是差分隐私领域的权威人士,著有《差分隐私的算法基础》一书。费德里吉说,罗斯用“开创性”一词评价了苹果在差分隐私方面的工作。

苹果表示,它可能会在iOS 10发布之前,发布差分隐私实施政策和数据保留政策方面的更多细节。

那么,这一切对你来说意味着什么呢?

键盘

在WWDC主旨演讲中,苹果宣布了iMessage的重大改进。差分隐私是这些改进的一大组成部分,因为苹果希望收集数据,用以改进QuickType和表情符号键盘的建议功能。在iOS 9中,QuickType在用户的个人设备上学习短语并更新字典——新词输入达到一定次数以后,自动更正就会停止修改动作。

但在iOS 10中,苹果将使用差分隐私,识别数十亿用户的用语趋势——因此,你可能会惊奇地发现,键盘给出的建议是你从未使用过的某个俚语。

“当然,让软件更加智能的重要工具之一,就是在众多用户之中发现使用规律,”费德里吉解释说。“比如,找出时下流行的新词,使QuickType键盘对新词信手拈来。”

差分隐私也一劳永逸地解决了常用表情符号之争,给表情符号键盘重新排序,爱心符号再也不会藏在散乱的星座符号和鸢尾花之间了。

Spotlight

在此之前,iOS 9为改进Spotlight搜索功能,引入了深度链接(deep linking)。费德里吉在去年的WWDC上揭晓了深度链接,他在演示中用Spotlight搜索了“土豆”,出现的是设备上其他应用中的菜谱,而不仅仅是网页搜索结果。

如今,被孤立在应用程序之中的信息越来越多,超越了传统搜索引擎的覆盖范围,为了这些内容变得可搜索,深度链接就成为必须。然而iOS 9该如何对深度链接的搜索结果进行排名,以防止不相关的建议泛滥Spotlight,这方面依然存在问题。

苹果计划使用差分隐私来解决这个问题。凭借被扰乱的用户数据,苹果可以将极受欢迎的深度链接识别出来,并分配以较高的排名——故而当你用Spotlight查找土豆食谱时,你会得到像Yummly这样的应用提供的最美味的土豆食谱。

Notes

iOS 10用差分隐私来加以改进的最后一项功能是Notes。

在主旨演讲中,费德里吉还讨论了Notes的改进。在iOS 10中,Notes将变得更具互动性,可操作信息将着重显示——打个比方,如果你在Notes中记下一位朋友的生日,它可能会着重显示该日期,建议你创建日历事件以得到提醒。

为提供此类智能建议,苹果需要知道用户普遍喜欢记录何种笔记,而这就要用到差分隐私。

工作原理

那么,差分隐私究竟是什么?它不是一种单一技术,宾夕法尼亚州立大学计算机科学与工程系副教授亚当·斯密(Computer Science)说,他与罗斯一道,从事这方面的研究已有十多年。

它其实是一种数据处理方式,在数据中加入限制,防止通过数据联系到具体个人。它允许你对数据进行总体分析,但会在提取自单独设备的数据中注入噪声,让数据在接受批量处理的同时,不至于危及个人隐私。

“严格来说,这是一个数学定义。它限制了你处理数据的方式,在数据集里面间隔取点的时候,任何点都不会链向太多信息,”史密斯说。

他用没有调准的电台打了个比方,差分隐私就好比在一层静态噪声之下,听到背后的旋律。“一旦你知道自己在听什么,忽略静态噪声就很容易了。你了解不到什么个人信息,但可以看到比较清晰的整体规律。

“如果对自己不加约束,不插入这些噪声,得到的规律还会更加清晰、准确。但为了更有力地保障用户隐私,这是必须作出的牺牲,”史密斯说。

史密斯认为,苹果是第一家尝试大规模采用差分隐私的公司,尽管他也承认,其他大型商业实体(如AT&T)也曾做过这方面的研究(可能让人意想不到的是,谷歌也通过Rappor项目做过这方面的研究)。他指出,初创企业也表现出了兴趣。

虽然除苹果之外,没有其他商业实体大规模部署差分隐私,但史密斯表示,这一概念的稳妥性是毋庸置疑的,不过他指出,实施也要得当才行。

“与任何事关安全性的技术一样,魔鬼就在细节间。落实必须非常妥善。但背后思路是非常稳妥的,这一点没有争议。”

AI的未来将受何影响?

史密斯说,苹果公司采用差分隐私是AI领域的一件大事,差分隐私或能给机器学习技术发挥作用的方式带来翻天覆地的变化。

在硅谷,隐私之争往往以执法视角呈现,体现为用户与美国国家安全之争。但在科技企业,隐私之争就成了用户隐私与功能之间的取舍。苹果引入差分隐私,可能会从根本上改变这场辩论。

谷歌和Facebook就一直困扰于这个问题:如何提供功能丰富同时又保护隐私的产品。谷歌的最新消息应用Allo以及Facebook的Messenger都不将端到端加密设为默认,因为两家公司都需要大量用户对话来提升机器学习,使聊天机器人运转起来。苹果也想从用户数据中获取深入的信息,但它不愿让端到端加密的iMessage开倒车。

史密斯说,苹果选择差分隐私,将使企业重新权衡保护隐私与改进机器学习之间的取舍。“我们现在收集那么多数据,但真正需要的根本没那么多,”史密斯说。“这类技术绝对是隐私保护的另一条出路。”

虽然iOS 10只会用差分隐私来改进键盘、深度链接及Notes,但史密斯指出,如果试水成功,苹果可能将此策略延伸到地图、语音识别等功能。史密斯说,苹果还可以看看人们在一天中哪些时段使用哪些应用。

苹果不收集原始用户数据,或能提升用户对它的信赖,同时在政府面前,苹果也可以展现出更加强硬的立场——在近期与FBI的官司大战之中,苹果就为了用户隐私据理力争。

由于差分隐私研究已有十年的积淀,它对苹果来说是个相对低风险的安全策略。史密斯表示,这个概念找到了创新和用户安全之间的“最佳位置”。

“无论苹果的成功是否彻底,这都将彻底改变隐私对话,”史密斯说。“我认为,人们对私人信息收集的看法将因此改变。这可能是苹果公司这一项目的最大遗产,也许会远远超出它对苹果业绩的影响。”

关键字:苹果可能谷歌

本文摘自:百度百家

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^