当前位置:大数据业界动态 → 正文

大数据真的能够威胁国家安全吗

责任编辑:editor006 作者:丁阳 |来源:企业网D1Net  2015-11-22 20:32:01 本文摘自:腾讯较真

导语:近日,一篇题为《警惕阿里巴巴的大数据造成国家安全威胁》①的文章在网上流传,作者是中国人民大学公共管理学院教授刘太刚。在流传过程中,也有左翼舆论将其包装为知名军方强硬派将领戴旭的观点,还改成了《阿里未来国有化是一种必然》这样的题目。这篇“大数据威胁国家安全论”靠谱吗?且看《较真》栏目查证。

 

在微博和微信上,称“阿里巴巴大数据将严重威胁国家安全”的文章都流传颇广

查证1、阿里巴巴并不能掌握“各种战略资源的流转”

这篇“大数据威胁国家安全论”的一个核心观点是,阿里巴巴可以“通过大数据挖掘建立起中国战略资源的流转及节点图”。——“阿里的大数据本身就包含各种商品流转的数据,通过各种商品的流转很容易分析出国家各种资源的流转,由此绘制出中国各种战略资源的流转及节点图……有了这样一份战略资源的流转及节点图,中国战略资源的薄弱环节就会清晰地展现出来。显然,无论战时还是平时,这样一份战略资源的流转及节点图都可用作瓦解国家安全的导航图。”

首先,虽然阿里巴巴在中国电商中占据主导地位,但据国家统计局和商务部数据显示,2014年全国网上零售额为2.8万亿元,还只占国内全年社会消费品零售总额26.2万亿元的10%出头。②而至于达到10万亿元规模的B2B电子商务市场,据中国电子商务研究中心发布的《2014年度中国电子商务市场数据监测报告》,阿里巴巴的份额是38.9%。③换言之,阿里巴巴还远未达到掌握绝大多数商品流转数据的程度。

更重要的是,阿里巴巴即便掌握商品流转的数据,距离分析出各种资源的流转也很远,更不要说在目前的占有规模下分析出“各种战略资源的流转”。

事实上,在今年稍早些时候,在药品领域,阿里巴巴曾面临过更具体的指责。南方周末报道称,按照国家食药总局的监管要求,中国各类药品从生产、流通、经营和消费等所有节点的全部信息,将会储存在“阿里云”上。当时就有人认为,阿里健康将就此“运用大数据的研究方法,分析药品电子监管码所蕴含的信息,能够绘制出国内的疾病发生的时间、地域、周期,进而掌握国人的健康情况;甚至还能通过药品流转,绘制出中国各种战略资源节点图。”④

然而这一说法在当时就被权威人士否定。中国疾病预防控制中心原副主任杨功焕认为,健康数据中更重要的是患者数据、医生诊断数据,然后才是相应的药物数据。“一种药品可以治疗很多种疾病,药品和疾病的一一对应关系本就存疑。”“单凭这个数据,得到战略节点是不可能的。”她认为药品相关数据最多只属于公共数据,没有达到涉及国家安全类数据的范畴。

所以,仅凭阿里巴巴掌握了很多电子商务数据,就认为这些数据有可能被制作成“瓦解国家安全的导航图”,是耸人听闻的说法。

 曾有人担心阿里健康掌握药品流通信息后,通过大数据分析,掌握国人健康资料

2、大数据的能力不应该被过度夸大

声称“大数据威胁国家安全”的这篇文章,还一个说法是,“阿里巴巴的大数据和云计算简直就是有史以来最为强大的情报搜集和分析系统——通过其大数据和云计算,中国人的一举一动及行为偏好都可以尽在其掌握之中。”这种说法完全是过分虚夸了大数据的能力。

2014年国际著名的《连线》杂志曾刊登了一篇关于大数据的评论文章。作者认为,如果缺乏对人们现实生活的实地调查,大数据没有什么意义。文章举了“谷歌流感趋势”为例子说明了大数据并没有那么强悍。谷歌公司推出的“谷歌流感趋势”是一个有明确目的的大数据分析案例,目的是:找出人们在流感季节常用的搜索词,然后实时跟踪这些搜索词的使用高峰期。这样,谷歌就可以在新流感爆发之前发出警报,而且预警时间要比官方疾病防治中心的预警时间早大约两周。但著名的《科学》杂志刊登的一篇文章告诉我们,自2011年8月以来,“谷歌流感趋势”几乎每周都会高估流感的盛行率。而在2009年,就在“谷歌流感趋势”推出后不久,它完全没有察觉猪流感的爆发。作者认为这并不是算法不够成熟的问题,而是“大数据”的能力不应被过分高估。⑤

事实上,要通过大数据分析出有价值的东西向来不是那么容易。数据一是收集难,二是存储难,三是处理难,四是呈现难。国际知名咨询公司Gartner的分析师Svetlana Sicular就曾因为大数据很难让用户得到满意的结果,就唱衰过大数据,认为“大数据热潮即将有所回落”。他引用了一个评论称,“一旦跟大数据扯上关系,我们就需要克服更多难题、投入更多精力,因为整个过程完全是在摸着石头过河”。还可以举一个知名的例子,著名在线影视内容提供商Netfilx曾举办了一个奖金一百万美金的比赛,netflix开放了一部分数据库的用户数据,要求每个参赛者根据这些数据预测这些用户未来对影视作品的打分。结果是,在赛事中排名第一的算法,其效果也不理想,Netflix也从未应用过,理由是认为这算法还不足以满足实际使用的需求。⑥所以,尽管阿里巴巴的系统公认结构化数据做得很好处理,但也不可能仅通过购物数据,就掌握出“中国人的一举一动及行为偏好”。

3、大数据对个人隐私的威胁的确存在,但并不是没有解决的办法

声称“大数据威胁国家安全”的这篇文章,还有一个比较唬人的说法,“通过大数据挖掘建立起中国要害人员的个人档案——档主的社会关系、性格禀赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷都尽在其中。”由此我国的士兵、外交官等的弱点就被尽在掌握,“甚至可以这样说,如果阿里的大数据能以现在的规模再累积30年,三十年后的中国领导人或许会从阿里的用户中产生。若此,阿里的大数据和云计算,差不多能披露三十年后领导人的个人隐私。”

相比前面提到的说法,大数据对个人隐私的威胁是比较贴近实际情况的。美国人同样也有这样的担心,2008年美国国家学术出版社出的一本《反恐战争中的个人隐私保护》就明确提到对数据的深度挖掘可能会威胁到隐私保护和公民自由。⑦《连线》杂志也称,“大数据是一把任何一面都锋利无比的双刃剑。尽管它有惊人的潜力让我们的世界变得更加美好,但是也可以被轻易地滥用于以赢利为目的的跟踪,甚至被用来跟踪并消除异己。”⑧

但对于这一点也并非没有办法解决。美国政府的思路就值得参考。在美国政府看来,大数据时代已经来临,数据收集变得无处不在,通过“告知与同意”框架来阻止企业收集、分析、使用个人数据乃至隐私变得日益困难,因此应该转换思路,要提出政策主张,发挥行业自律作用,并且强调事后责任,来解决这一问题。具体来说,就是要求企业注重数据采集与使用的透明度,“企业应当清楚地说明如下信息:收集个人数据的种类;收集个人数据的原因;所收集的个人数据的用途;在何种条件下删除数据或者删除数据中消费者的身份信息;是否与第三方分享个人数据以及分享的目的等。法案重点要求企业公开与个人数据原定使用情境不一致的行为,公开与消费者的预期不一致的个人数据使用行为。”强调事后问责,就是指一旦发生数据或隐私外泄,不仅公司内部需要控制和问责机制,更要对消费者和执法机构承担外部责任。《消费者隐私权利法案》提出了十分详细具体的问责事由,涵盖企业员工行为控制、内部数据使用监督、向第三方公开数据等方面,使事后问责更为明确具体。 ⑨

4、即便担忧对国家安全产生威胁,也不必动辄高呼“国有化”

这篇认为“大数据威胁国家安全”的文章最后得出的结论是,“如果往前走,阿里的未来只有一条路,就是国有化。”这一个非常粗暴的思路,以国家安全为由干涉市场经济,干涉企业自主。实际上即使大数据真的威胁到了国家安全,首先考虑的方式也应该是加强监管,而不是在所有权方面动脑筋,损害企业效率。从美国政府“大数据白皮书”来看,美国人对大数据带来的可能风险,采取的是更为积极的态度,更为看重大数据为经济社会发展所带来的创新动力,产生问题是想办法解决,而不是对其抱着洪水猛兽的态度。⑨

 图为某数据中心的机房 

关键字:Netfilx数据挖掘

本文摘自:腾讯较真

x 大数据真的能够威胁国家安全吗 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据真的能够威胁国家安全吗

责任编辑:editor006 作者:丁阳 |来源:企业网D1Net  2015-11-22 20:32:01 本文摘自:腾讯较真

导语:近日,一篇题为《警惕阿里巴巴的大数据造成国家安全威胁》①的文章在网上流传,作者是中国人民大学公共管理学院教授刘太刚。在流传过程中,也有左翼舆论将其包装为知名军方强硬派将领戴旭的观点,还改成了《阿里未来国有化是一种必然》这样的题目。这篇“大数据威胁国家安全论”靠谱吗?且看《较真》栏目查证。

 

在微博和微信上,称“阿里巴巴大数据将严重威胁国家安全”的文章都流传颇广

查证1、阿里巴巴并不能掌握“各种战略资源的流转”

这篇“大数据威胁国家安全论”的一个核心观点是,阿里巴巴可以“通过大数据挖掘建立起中国战略资源的流转及节点图”。——“阿里的大数据本身就包含各种商品流转的数据,通过各种商品的流转很容易分析出国家各种资源的流转,由此绘制出中国各种战略资源的流转及节点图……有了这样一份战略资源的流转及节点图,中国战略资源的薄弱环节就会清晰地展现出来。显然,无论战时还是平时,这样一份战略资源的流转及节点图都可用作瓦解国家安全的导航图。”

首先,虽然阿里巴巴在中国电商中占据主导地位,但据国家统计局和商务部数据显示,2014年全国网上零售额为2.8万亿元,还只占国内全年社会消费品零售总额26.2万亿元的10%出头。②而至于达到10万亿元规模的B2B电子商务市场,据中国电子商务研究中心发布的《2014年度中国电子商务市场数据监测报告》,阿里巴巴的份额是38.9%。③换言之,阿里巴巴还远未达到掌握绝大多数商品流转数据的程度。

更重要的是,阿里巴巴即便掌握商品流转的数据,距离分析出各种资源的流转也很远,更不要说在目前的占有规模下分析出“各种战略资源的流转”。

事实上,在今年稍早些时候,在药品领域,阿里巴巴曾面临过更具体的指责。南方周末报道称,按照国家食药总局的监管要求,中国各类药品从生产、流通、经营和消费等所有节点的全部信息,将会储存在“阿里云”上。当时就有人认为,阿里健康将就此“运用大数据的研究方法,分析药品电子监管码所蕴含的信息,能够绘制出国内的疾病发生的时间、地域、周期,进而掌握国人的健康情况;甚至还能通过药品流转,绘制出中国各种战略资源节点图。”④

然而这一说法在当时就被权威人士否定。中国疾病预防控制中心原副主任杨功焕认为,健康数据中更重要的是患者数据、医生诊断数据,然后才是相应的药物数据。“一种药品可以治疗很多种疾病,药品和疾病的一一对应关系本就存疑。”“单凭这个数据,得到战略节点是不可能的。”她认为药品相关数据最多只属于公共数据,没有达到涉及国家安全类数据的范畴。

所以,仅凭阿里巴巴掌握了很多电子商务数据,就认为这些数据有可能被制作成“瓦解国家安全的导航图”,是耸人听闻的说法。

 曾有人担心阿里健康掌握药品流通信息后,通过大数据分析,掌握国人健康资料

2、大数据的能力不应该被过度夸大

声称“大数据威胁国家安全”的这篇文章,还一个说法是,“阿里巴巴的大数据和云计算简直就是有史以来最为强大的情报搜集和分析系统——通过其大数据和云计算,中国人的一举一动及行为偏好都可以尽在其掌握之中。”这种说法完全是过分虚夸了大数据的能力。

2014年国际著名的《连线》杂志曾刊登了一篇关于大数据的评论文章。作者认为,如果缺乏对人们现实生活的实地调查,大数据没有什么意义。文章举了“谷歌流感趋势”为例子说明了大数据并没有那么强悍。谷歌公司推出的“谷歌流感趋势”是一个有明确目的的大数据分析案例,目的是:找出人们在流感季节常用的搜索词,然后实时跟踪这些搜索词的使用高峰期。这样,谷歌就可以在新流感爆发之前发出警报,而且预警时间要比官方疾病防治中心的预警时间早大约两周。但著名的《科学》杂志刊登的一篇文章告诉我们,自2011年8月以来,“谷歌流感趋势”几乎每周都会高估流感的盛行率。而在2009年,就在“谷歌流感趋势”推出后不久,它完全没有察觉猪流感的爆发。作者认为这并不是算法不够成熟的问题,而是“大数据”的能力不应被过分高估。⑤

事实上,要通过大数据分析出有价值的东西向来不是那么容易。数据一是收集难,二是存储难,三是处理难,四是呈现难。国际知名咨询公司Gartner的分析师Svetlana Sicular就曾因为大数据很难让用户得到满意的结果,就唱衰过大数据,认为“大数据热潮即将有所回落”。他引用了一个评论称,“一旦跟大数据扯上关系,我们就需要克服更多难题、投入更多精力,因为整个过程完全是在摸着石头过河”。还可以举一个知名的例子,著名在线影视内容提供商Netfilx曾举办了一个奖金一百万美金的比赛,netflix开放了一部分数据库的用户数据,要求每个参赛者根据这些数据预测这些用户未来对影视作品的打分。结果是,在赛事中排名第一的算法,其效果也不理想,Netflix也从未应用过,理由是认为这算法还不足以满足实际使用的需求。⑥所以,尽管阿里巴巴的系统公认结构化数据做得很好处理,但也不可能仅通过购物数据,就掌握出“中国人的一举一动及行为偏好”。

3、大数据对个人隐私的威胁的确存在,但并不是没有解决的办法

声称“大数据威胁国家安全”的这篇文章,还有一个比较唬人的说法,“通过大数据挖掘建立起中国要害人员的个人档案——档主的社会关系、性格禀赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷都尽在其中。”由此我国的士兵、外交官等的弱点就被尽在掌握,“甚至可以这样说,如果阿里的大数据能以现在的规模再累积30年,三十年后的中国领导人或许会从阿里的用户中产生。若此,阿里的大数据和云计算,差不多能披露三十年后领导人的个人隐私。”

相比前面提到的说法,大数据对个人隐私的威胁是比较贴近实际情况的。美国人同样也有这样的担心,2008年美国国家学术出版社出的一本《反恐战争中的个人隐私保护》就明确提到对数据的深度挖掘可能会威胁到隐私保护和公民自由。⑦《连线》杂志也称,“大数据是一把任何一面都锋利无比的双刃剑。尽管它有惊人的潜力让我们的世界变得更加美好,但是也可以被轻易地滥用于以赢利为目的的跟踪,甚至被用来跟踪并消除异己。”⑧

但对于这一点也并非没有办法解决。美国政府的思路就值得参考。在美国政府看来,大数据时代已经来临,数据收集变得无处不在,通过“告知与同意”框架来阻止企业收集、分析、使用个人数据乃至隐私变得日益困难,因此应该转换思路,要提出政策主张,发挥行业自律作用,并且强调事后责任,来解决这一问题。具体来说,就是要求企业注重数据采集与使用的透明度,“企业应当清楚地说明如下信息:收集个人数据的种类;收集个人数据的原因;所收集的个人数据的用途;在何种条件下删除数据或者删除数据中消费者的身份信息;是否与第三方分享个人数据以及分享的目的等。法案重点要求企业公开与个人数据原定使用情境不一致的行为,公开与消费者的预期不一致的个人数据使用行为。”强调事后问责,就是指一旦发生数据或隐私外泄,不仅公司内部需要控制和问责机制,更要对消费者和执法机构承担外部责任。《消费者隐私权利法案》提出了十分详细具体的问责事由,涵盖企业员工行为控制、内部数据使用监督、向第三方公开数据等方面,使事后问责更为明确具体。 ⑨

4、即便担忧对国家安全产生威胁,也不必动辄高呼“国有化”

这篇认为“大数据威胁国家安全”的文章最后得出的结论是,“如果往前走,阿里的未来只有一条路,就是国有化。”这一个非常粗暴的思路,以国家安全为由干涉市场经济,干涉企业自主。实际上即使大数据真的威胁到了国家安全,首先考虑的方式也应该是加强监管,而不是在所有权方面动脑筋,损害企业效率。从美国政府“大数据白皮书”来看,美国人对大数据带来的可能风险,采取的是更为积极的态度,更为看重大数据为经济社会发展所带来的创新动力,产生问题是想办法解决,而不是对其抱着洪水猛兽的态度。⑨

 图为某数据中心的机房 

关键字:Netfilx数据挖掘

本文摘自:腾讯较真

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^