当前位置:大数据业界动态 → 正文

大数据不是万灵药

责任编辑:王李通 |来源:企业网D1Net  2014-04-30 08:27:02 本文摘自:人民日报

毋庸置疑,规模更大、更新更快的大数据拥有深刻的洞察力,也终将带来价值。有些鼓吹者认为,随着数据采集和分析工具进一步完善,数据就能大到可以自己得出结论。甚至谁掌握了大数据,谁就能够预知未来。

这种把大数据当万灵药的观点是危险的。首先,在低价值密度的大数据中,数据往往是混杂的,找到“货真价实”的信息已属不易,而“知其然,不求知其所以然”,只考虑纯粹相关性,而不注重数据与结论之间的因果关系的分析方法,在现实中往往经不起推敲。

此外,由于存在样本误差和偏差等种种“陷阱”,通过统计数据来认知现实世界从来都不能尽善尽美,而这些不是简单的依靠扩大样本规模就可以避免。比如,理论上可以通过分析微博上的每一次发言,推断出某一事件引发的公共情绪,但不可忽视的是,微博活跃用户并不代表更大外延的所有人。

大数据时代已经来临,但它并非无所不能。一方面,我们在不能矮化大数据为“旧瓶装新酒”的同时,更不能迷信大数据为万灵药。否则,带着“数据自己可以说出结论”的傲慢,不小心就可能掉进了数据的“陷阱”,从而使大数据成为“大错误”。我们的切实态度或许是,在尊重传统的统计经验基础上,借助更大规模的数据,解决新问题,才能期望获得真正的大价值。

关键字:陷阱微博大数据

本文摘自:人民日报

x 大数据不是万灵药 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据不是万灵药

责任编辑:王李通 |来源:企业网D1Net  2014-04-30 08:27:02 本文摘自:人民日报

毋庸置疑,规模更大、更新更快的大数据拥有深刻的洞察力,也终将带来价值。有些鼓吹者认为,随着数据采集和分析工具进一步完善,数据就能大到可以自己得出结论。甚至谁掌握了大数据,谁就能够预知未来。

这种把大数据当万灵药的观点是危险的。首先,在低价值密度的大数据中,数据往往是混杂的,找到“货真价实”的信息已属不易,而“知其然,不求知其所以然”,只考虑纯粹相关性,而不注重数据与结论之间的因果关系的分析方法,在现实中往往经不起推敲。

此外,由于存在样本误差和偏差等种种“陷阱”,通过统计数据来认知现实世界从来都不能尽善尽美,而这些不是简单的依靠扩大样本规模就可以避免。比如,理论上可以通过分析微博上的每一次发言,推断出某一事件引发的公共情绪,但不可忽视的是,微博活跃用户并不代表更大外延的所有人。

大数据时代已经来临,但它并非无所不能。一方面,我们在不能矮化大数据为“旧瓶装新酒”的同时,更不能迷信大数据为万灵药。否则,带着“数据自己可以说出结论”的傲慢,不小心就可能掉进了数据的“陷阱”,从而使大数据成为“大错误”。我们的切实态度或许是,在尊重传统的统计经验基础上,借助更大规模的数据,解决新问题,才能期望获得真正的大价值。

关键字:陷阱微博大数据

本文摘自:人民日报

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^