当前位置:新闻中心行业动态 → 正文

清华大学教授武永卫:数据社交核心问题就是大数据

责任编辑:sjia |来源:企业网D1Net  2012-03-08 09:58:04 原创文章 企业网D1Net

“清华大学校园里面,有两万的用户,仅仅是清华大学的学生和老师来用,对其他人不给用,因为我们不像新浪这么大的全球用户,但数据量已经的100T了。”清华大学教授武永卫表示。

数据社交核心问题就是数据量比较大,如果只是消息的话,建议大家用新浪,我们以大数据量为核心。

所谓的数据社交是什么?就是希望认识的是一些志同道合的人。武教授介绍:在清华这种需求很强烈:有的同学对Mac开发程序感兴趣,他们希望互相交流,代码贡献出来。对Mac没有开发的程序,暴露出来无非就是一个垃圾,但是对有兴趣的人,这就是一个宝贝。所以具有真实的社会关系或者具有共同的特征。

真实的社会关系,如每个家庭分享各自的旅游照片。武教授兴致勃勃地说到:“现在一张照片5到10兆、几百兆,怎么给父母看?只能抱着一个电脑,插上U盘来进行观看。如果父母在外地的话,这件事情就麻烦了,几百G的东西没有很快进行共享。我们说的就是 数据创造,创造出数据,然后把数据分享给别人,跟别人共同分享为核心,这就是数据社交。我刚刚说了清华的Mac编程,还有一个清华的跳水队,用我们的社区概念。就是在我们社区放500G的东西,我们偷偷的看了一下,我也没有看到他们的数据,也偷偷看了一下,为什么放这么多数据,跳水动作的照片, 还有视频内容,到跳水馆,拿一个Pad一播,就给他们看一下,纠正跳水的问题。一拍一上传,队员在宿舍里面各自又可以看这些照片了,他们就是做这个事情。”

当一个数据平台做好的时候,上面的应用可以很多,打游戏也罢,我非常吃惊的一点,去年不知道康熙来了,去年才知道,这个节目看的人很多,有的人天天把 康熙来了放上去,就在安卓手机上开发这样的应用,在校园网通过Wi-Fi,3G也可以看,就可以看里面的频道。这个东西每天有300个人看,就是300次的 观看,在校园网。这是最高的,挺好玩的,就看了一下,当你有了数据,有了对外开发的接口,网络的系统暴露出来,开发出来的App可以有很多。照相机做一个插件,照的照片可以上传上来,应用做到成千上万,Appstore很多。

大的数据量修改也有关系。客户端都是分布的,大家在不同的渠道到一个地方,访问数据中心的地方,数据中心的地方是瓶颈,数据中心的地方解决这个瓶颈的时候,只有两个办法。第一,多放数据服务器,为什么说广泛分布,多放数据服务器,每一个服务器对外都是千兆带宽。第二,每一个服务器都有光纤的出口很好,清华都是光纤,其他学校做不到,也没有办法。广泛分布之后,带来的问题也非常简单,一致性、维护拷贝等所有都要搞定。广泛分布以后,怎么管理好,怎么让大家不经过中间这一块,登录之后直接获取服务器的数据,进行修改和读取,技术的改变,在中间都要记录下来,没有中间这一块,用户正在读取数据,中间机器宕了,也没有问题。或者就是修改和读取的数据没有记录下来,希望通过客户端里面加一些内容,比如说做了哪些做了修改注册以后,收尾的时候,告诉服务器,修改哪些数据,然后再做原数据的搜索。原数据的管理,是做我们这个广泛分布系统的核心,也是最难的地方。我们大概有几百个问题。 

关键字:大数据

原创文章 企业网D1Net

x 清华大学教授武永卫:数据社交核心问题就是大数据 扫一扫
分享本文到朋友圈
当前位置:新闻中心行业动态 → 正文

清华大学教授武永卫:数据社交核心问题就是大数据

责任编辑:sjia |来源:企业网D1Net  2012-03-08 09:58:04 原创文章 企业网D1Net

“清华大学校园里面,有两万的用户,仅仅是清华大学的学生和老师来用,对其他人不给用,因为我们不像新浪这么大的全球用户,但数据量已经的100T了。”清华大学教授武永卫表示。

数据社交核心问题就是数据量比较大,如果只是消息的话,建议大家用新浪,我们以大数据量为核心。

所谓的数据社交是什么?就是希望认识的是一些志同道合的人。武教授介绍:在清华这种需求很强烈:有的同学对Mac开发程序感兴趣,他们希望互相交流,代码贡献出来。对Mac没有开发的程序,暴露出来无非就是一个垃圾,但是对有兴趣的人,这就是一个宝贝。所以具有真实的社会关系或者具有共同的特征。

真实的社会关系,如每个家庭分享各自的旅游照片。武教授兴致勃勃地说到:“现在一张照片5到10兆、几百兆,怎么给父母看?只能抱着一个电脑,插上U盘来进行观看。如果父母在外地的话,这件事情就麻烦了,几百G的东西没有很快进行共享。我们说的就是 数据创造,创造出数据,然后把数据分享给别人,跟别人共同分享为核心,这就是数据社交。我刚刚说了清华的Mac编程,还有一个清华的跳水队,用我们的社区概念。就是在我们社区放500G的东西,我们偷偷的看了一下,我也没有看到他们的数据,也偷偷看了一下,为什么放这么多数据,跳水动作的照片, 还有视频内容,到跳水馆,拿一个Pad一播,就给他们看一下,纠正跳水的问题。一拍一上传,队员在宿舍里面各自又可以看这些照片了,他们就是做这个事情。”

当一个数据平台做好的时候,上面的应用可以很多,打游戏也罢,我非常吃惊的一点,去年不知道康熙来了,去年才知道,这个节目看的人很多,有的人天天把 康熙来了放上去,就在安卓手机上开发这样的应用,在校园网通过Wi-Fi,3G也可以看,就可以看里面的频道。这个东西每天有300个人看,就是300次的 观看,在校园网。这是最高的,挺好玩的,就看了一下,当你有了数据,有了对外开发的接口,网络的系统暴露出来,开发出来的App可以有很多。照相机做一个插件,照的照片可以上传上来,应用做到成千上万,Appstore很多。

大的数据量修改也有关系。客户端都是分布的,大家在不同的渠道到一个地方,访问数据中心的地方,数据中心的地方是瓶颈,数据中心的地方解决这个瓶颈的时候,只有两个办法。第一,多放数据服务器,为什么说广泛分布,多放数据服务器,每一个服务器对外都是千兆带宽。第二,每一个服务器都有光纤的出口很好,清华都是光纤,其他学校做不到,也没有办法。广泛分布之后,带来的问题也非常简单,一致性、维护拷贝等所有都要搞定。广泛分布以后,怎么管理好,怎么让大家不经过中间这一块,登录之后直接获取服务器的数据,进行修改和读取,技术的改变,在中间都要记录下来,没有中间这一块,用户正在读取数据,中间机器宕了,也没有问题。或者就是修改和读取的数据没有记录下来,希望通过客户端里面加一些内容,比如说做了哪些做了修改注册以后,收尾的时候,告诉服务器,修改哪些数据,然后再做原数据的搜索。原数据的管理,是做我们这个广泛分布系统的核心,也是最难的地方。我们大概有几百个问题。 

关键字:大数据

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^