(本文作者为美Infoworld专栏作家 Robert X. Cringely)
奥巴马胜选的原因不在于经济、外交政策或是妇女问题,而是赢在大数据。
在本届激烈而漫长的总统竞选活动落下帷幕后,对于竞选的最终结果,关于谁应当被信任或是受到指责出现了大量争论。此外,我认为人们还将会继续关注飓风、攻击式竞选方式、改换党派的州长、秘密视频记录、愤怒的西班牙裔、怒火中烧的女权主义者和需要闭上嘴巴的候选人。
如果你是推特上的Ted Nugent(注:著名摇滚明星),你可能会把这些归咎于“皮条客、娼妓、福利骗子、没有灵魂的傻子和禽兽一般的恶棍” 。
但是还是让我们忘掉这些吧。无论你支持哪个阵营,奥巴马的胜出和罗姆尼的落选都可以归结为大数据的利用。是的,我知道,与“云计算”和“可能给你打电话”一样,“大数据”也已经成为了一个让人们感到厌倦了的词汇,但是总统竞选确实是一个非常适用于大数据的地方。
Time.com网站已经非常出色的报道了奥巴马竞争活动为什么会成功的原因。这一切始于2008年,当时奥巴马的支持者继承了民主党多年以来所创建的糟糕的孤岛式数据库。在赢得了大选后,奥巴马的团队抛弃了这些孤岛式数据库并重新建立了新式数据库。新式数据库增加了大量来自Web追踪和社交媒体网站的新数据。
在经过了18个月的数据处理,奥巴马的团队搞清楚了如何在先前海量的非结构化数据中找到不同的利用模式。它们知道应当以哪些区域为目标以及应当忽视哪些人,知道哪些信息能够吸引女性和少数民族选民,知道在哪里花钱效果更好。它们还知道依靠哪些人才有可能得到增强竞争力的捐款,以及如何发出呼吁。以下是Per Time的Michael Scherer的观点:
新的海量数据不仅仅告诉竞争团队如何找到选民并吸引他们的注意力,而且还允许数据分析团体预测通过哪种特定方式发出呼吁可劝说哪类选民。
一名负责利用数据创建预测方案的高级顾问称:“我们能够预测哪些选民将在线捐赠,能够对那些通过邮局进行捐赠的选民进行建模,也能够对志愿者进行建模。”
事实证明,如果你在竞争广告中使用乔治·克鲁尼,那么女性选民将会为你慷慨解囊。