当前位置:大数据业界动态 → 正文

一个大数据应用的真实案例

责任编辑:editor007 |来源:企业网D1Net  2015-07-27 17:39:41 本文摘自:中国大数据

大数据应用案例

某老师是教统计软件的女博士,某天女博士突然想研究一下自己的老公是否出轨了(完全的突发奇想,或者是女人的第六感),我觉得完全是因为她无聊就自己编写了一套评价老公和其他女性亲密度的系统。类似于现在qq空间的那套亲密度系统。

这套科学的系统是基于新浪微博的,她用爬虫获取老公的微博动态和所有好友数据。以一种科学的赋权方法计分,例如超过多少字加多少分,含有么么哒等敏感词加多少分,以及含有表情符号加多少分。

结果是!结果是她居然比几个人都低!(当然了,女博士可能不玩微博,和老公的评分低一点可以理解)但是对于一个从事科研的数据学家来说,一切数据都是有意义的。其中得分最高的那个人被她视作异常值。所以她调查了这个异常值,是她老公的同事,不过她没有直接发飙。而是默默等待,一直监视着两个人的微博。

直到有一次老公说要去某地出差几天,果然发现了那个女人发了一条微博,内容大概就是谢谢有你的陪伴啊。结果就不用多说了,直接开车过去捉奸在床。

果断离婚,高额赔偿。她老公是什么感受我不知道,不过男生听完脊柱发凉,女生听完无比膜拜....

关键字:老公微博数据异常值

本文摘自:中国大数据

x 一个大数据应用的真实案例 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

一个大数据应用的真实案例

责任编辑:editor007 |来源:企业网D1Net  2015-07-27 17:39:41 本文摘自:中国大数据

大数据应用案例

某老师是教统计软件的女博士,某天女博士突然想研究一下自己的老公是否出轨了(完全的突发奇想,或者是女人的第六感),我觉得完全是因为她无聊就自己编写了一套评价老公和其他女性亲密度的系统。类似于现在qq空间的那套亲密度系统。

这套科学的系统是基于新浪微博的,她用爬虫获取老公的微博动态和所有好友数据。以一种科学的赋权方法计分,例如超过多少字加多少分,含有么么哒等敏感词加多少分,以及含有表情符号加多少分。

结果是!结果是她居然比几个人都低!(当然了,女博士可能不玩微博,和老公的评分低一点可以理解)但是对于一个从事科研的数据学家来说,一切数据都是有意义的。其中得分最高的那个人被她视作异常值。所以她调查了这个异常值,是她老公的同事,不过她没有直接发飙。而是默默等待,一直监视着两个人的微博。

直到有一次老公说要去某地出差几天,果然发现了那个女人发了一条微博,内容大概就是谢谢有你的陪伴啊。结果就不用多说了,直接开车过去捉奸在床。

果断离婚,高额赔偿。她老公是什么感受我不知道,不过男生听完脊柱发凉,女生听完无比膜拜....

关键字:老公微博数据异常值

本文摘自:中国大数据

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^