大数据的冰火两重天

责任编辑:editor004

作者:李改燕

2015-02-06 10:57:04

摘自:中国信息报

大数据以势如破竹的姿态高歌奋进,比起最初的“犹抱琵琶半遮面”越来越直观形象。以上是大数据的火,任何一个新生事物的出现,都是一把双刃剑,大数据无疑也是冰火两重天,允许我引用一个小笑话来说明。

大数据以势如破竹的姿态高歌奋进,比起最初的“犹抱琵琶半遮面”越来越直观形象。作为一个天天与数据亲密接触的统计人员,对大数据知识却知之甚少,于是徘徊在大数据的门前,除了了解网站上一些关于大数据的诠释与解读,也粗读了舍恩伯格的先河之作《大数据时代》,对大数据有了一个初步的概念框架,冰火两重天是我眼中的大数据标签。

在这个字符堆叠的网络时代和信息世界里,网民的纤纤细指就代表了绝对民意,在百度“大数据”上,综合搜索排名、超人气移动搜索指数告诉我们谁稳坐“收视第一”、“一哥一姐”宝座,大数据会说话,它会精确告诉你男女比例、年龄构成、地域分布等关注人群的各种讯息,甚至可以根据这些信息决定电视剧、电影何时何地针对何人拍摄,票房更能超预期。

导演张一白执导了消费“80后”青春的《匆匆那年》,把15年的时光切成一个个碎片,拼凑出了这代人无法安放的青春。因为“80后”为贡献票房的主力军,他们看的不只是电影,还有自己的回忆、感觉及情绪。与此同时,选在2014年12月份上映,即将挥别过去,网友们会用“匆匆那年到匆匆这年”来回顾自己这一年,所以《匆匆那年》成为观众最重要的情绪宣泄口,那些一路伴随着我们走过的人,一起激活过去的共同回忆,相比其他电影,《匆匆那年》的一大优势,就是它给了观众一个回顾和缅怀过去的理由,一个和老朋友老同学相聚的理由,观众会为了这个理由买单。而电影只是造梦的工具,这个梦里有自己,有死党,有酸涩的初恋,有动人的友情,《匆匆那年》通过一些网络大数据恰好让这些美好时光照进了现实。所以数据时代,网民点击才是人气,是民意,更是成绩单。

大数据也运用于各种运动赛事,搜集对手资料,然后研讨战略,分析结果,德国在2014世界杯胜出竟然是得益于应用数据分析最到位,一台IPAD就算出对手布局漏洞。在交通上,坐车的人、开车的人甚至包括车都是大数据的一分子;在移动通讯里,我们的通话记录浏览历史甚至手机型号都是浩瀚数海的一部分,在这世界上没有比数字更真实的东西。

会当凌绝顶,一览众山小。数据大亨百度在山西投资上百亿元建立大数据处理中心,并尝试在搜索引擎中装备“大数据”马达,让搜索先“大”起来。比如,实物识别功能,只需将手机对准一朵鲜花,通过“大数据”处理,屏幕会立即显示出此花的名称、特性、种植要点等,还会逐一呈现类似鲜花。这只是大数据的大材小用,百度又隆重推出为传统企业互联网转型服务的“直达号”,用户只须用手机@商家账号,并提出任何服务需求,百度立即可以上传至“大数据”,通过“云计算”将商家与用户零距离沟通,让供需方迅速“直达”,实现需求。

以上是大数据的火,任何一个新生事物的出现,都是一把双刃剑,大数据无疑也是冰火两重天,允许我引用一个小笑话来说明。

某比萨店的电话铃响了。

客服:“XXX比萨店。您好,请问您有什么需要?烦请先把您的会员卡号告诉我。”

顾客:“16846146***。”

客服:“陈先生,您好!您是住在泉州路一号12楼120x室,请问您想要点什么?”

顾客:“我想要一个海鲜比萨……”

客服:“陈先生,海鲜比萨不适合您,根据您的医疗记录,你的血压和胆固醇都偏高。您可以试试我们的低脂健康比萨。因为您上星期一在中央图书馆借了一本《低脂健康食谱》。”

顾客:“好,那我要一个家庭特大号比萨,要付多少钱?”

客服:“99元,这个足够您一家6口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。”

顾客:“那可以刷卡吗?”

客服:“陈先生,对不起。请您付现款,因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。您也不能去提款机取款,因为您已经超今日提款限额。”

顾客:“你们直接把比萨送我家吧,家里有现金。你们多久会送到?”

客服:“大约30分钟。如果您不想等,可以自己骑车来。根据我们全球定位的自动跟踪系统记录,您有一辆车号为SB-748的摩托车,而目前您正在解放路东段骑着这辆摩托车……”

两年前,腾讯QQ曾经推出朋友圈功能,它基于用户的好友关系以及其他资料进行分析,准确推出用户的真实姓名。很多用户的真实名字出现在朋友圈中,用户的强烈抗议导致腾讯关闭这一功能。用户真实姓名被腾讯朋友圈曝光仅仅是用户隐私泄露的一方面,这背后的数据分析才是令用户倍感恐怖的地方。试想,如果腾讯QQ没有掌握到用户的隐私,如何知道用户的真实姓名,以及真实的社交关系?当使用电子邮件、社交网络的时候,你的信息正在被记录下来,发表的言论或者分享的照片、视频等都决定着互联网运营商即将向你推荐什么样的资源和广告;当你在享受着视频监控带来的安全感的同时,你也是被监控的一分子,你的一举一动都会暴露在镜头下面;你用手机通话时,运营商不仅知道你打给谁,打了多久,还知道你是在哪里进行的通话,试想当你什么举动都可以被预测,相当于你裸体暴露在阳光下,换成你,害怕吗?

这些都告诉我们,我们的隐私在大数据时代遭遇前所未有的一览无遗,如何保证公民信息不被滥用乱用,公民隐私不肆意流离失所,需要我们法制之剑抛光磨亮,青锋出鞘,亟待我们政府信息之门张弛有度,动静结合。

不管怎样的冰火两重天,大数据的公开与分享已经成为大势所趋,政府部门必须身先士卒。2014年10月28日,中国国家统计局和联合国统计司联合举办“大数据和官方统计”国际会议,马建堂在致辞中指出,当今世界正在经历一场伟大的“数据革命”,政府官方统计同样面临着大数据时代的挑战、影响和难得的发展机遇。中国官方统计始终以开放的姿态和创新的勇气,真诚拥抱大数据,倾力使用大数据。

看过作家刘震云讲述的一个故事,他在德国杜塞尔多夫访问的时候,跟德国朋友在莱茵河边吃饭,闲聊之际顺口问莱茵河有多深?结果几个德国朋友很紧张,凑在一块嘀咕半天,刘震云很好奇,德国朋友说,这个问题特别难回答,因为莱茵河的水深春天和夏天不一样,夏天和秋天不一样,而秋天又和冬天不一样,很难说出一个确切数据。而这个问题换作是我们,可能会马上告诉别人大概多少米。历史学家黄仁宇说中国最缺乏的就是数字管理,所以,大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代,对于我们政府统计部门来说,首先养成用数据说话的意识和习惯,比大数据本身,更为重要。

我相信,大数据为我们提供的不是最终答案,只是参考答案,更好的方法和答案还在不久的未来;我亦相信,未来的大数据的发展会如舍恩伯格所说的,是一场生活、工作与思维的革命,会给我们带来更多更多的美好。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号