当前位置:大数据业界动态 → 正文

大数据生态链需要“半成品”提供者

责任编辑:editor004 作者:关健 |来源:企业网D1Net  2015-06-09 21:26:00 本文摘自:一财网

大数据生态中包括各种角色分工,每家公司都想从源头收集做到最后的数据应用,是不现实的,门槛太高,国内市场缺少专门做“数据半成品”的中间层角色,而美国一年来已经涌现出不少这种做数据中间层的创业公司。

“手上有鱼翅了,你让他做一个佛跳墙,他做不出来。”喜欢粤菜口味的香港人车品觉,这样形容大数据的价值(鱼翅)以及企业目前对大数据的挖掘和应用能力(烹饪佛跳墙)。在他看来,大数据挖掘就像做菜。

大数据里潜藏着巨大的宝矿,甚至被马云视为未来商业社会的石油和经济驱动力,仿佛企业(特别是互联网公司)现在不谈论大数据就是out的,但实际真正能将大数据运用到场景中的少之又少。

像通过跟踪一个人敲击键盘的速度和间隔来判断他在购物网站上的目的(是闲逛还是有目的购物)以及购买意愿的程度,背后的大数据发现了电商网站本不知道的内容。

近日,《第一财经日报》在阿里巴巴西溪园区办公室专访了阿里数据技术产品部负责人车品觉,《决战大数据》一书作者。他带领着320人,探索着数据对阿里平台业务的价值,包括双十一期间的数据预判。

车品觉认为,大数据生态中包括各种角色分工,每家公司都想从源头收集做到最后的数据应用,是不现实的,门槛太高,国内市场缺少专门做“数据半成品”的中间层角色,而美国一年来已经涌现出不少这种做数据中间层的创业公司。

国内大数据市场缺少中间层

在阿里巴巴,车品觉所在的数据技术产品部相对是一条很少对外的业务线,每时每刻,阿里平台上有关电商、物流、金融等各个业务线的数据汇聚到这里,有人做数据准备工作(提炼底层数据),有人是数据产品经理,还有一部分是数据分析师,各自分工明确,数据的收集、提炼、分析、整合、算法、应用等,自身就好比一个大数据生态链的迷你版本。

改成: 数据的收集、存储、刷新、整合、辨识、关联、分析、应用等,自身就好比一个大数据生态链的迷你版本。

双十一当天在阿里园区报告厅里的动态数据大屏就是这个部门做的。2014年的双十一,车品觉手下的员工不再像前几次双十一那样全员通宵达旦地紧盯后台,很多人早早回家睡觉了,因为前期准备中已经做好了各项数据产品和交易预判。

在美国,有一家基于LBS的创业公司,它具备的能力是,当你告诉它任意一个地址,它能反馈这周围都有什么业态。后来,这家公司把这种大数据中间层(半成品)产品卖给了苹果公司,用于增强后者的地图功能。

车品觉说,今年类似的围绕大数据中间层的创业公司在美国大量涌现,存在于农业、医疗、物流等通行业中,他们为大数据的应用场景提供数据加工的半成品,这其中隐藏着巨大的商机。

但国内的大数据生态链缺少的就是这种中间层公司。“底层数据的收集和筛选是一项很苦的活儿。”车品觉说,大数据的分析应用就像餐馆做菜,不是每道菜都从初始原材料做起,需要有人专门提供半成品,数据分析师通常需要花费80%甚至更多的时间在数据清洗和准备阶段。

像研究天气与零售的关系,交通对物流的影响等,这些大数据背后都蕴藏着商业价值。美国有一家专门收集工作岗位与年薪信息的网站Glassdoor,越来越成为投资人的新宠。因为该网站汇集了大量有关雇主评价、职场吐槽、招聘面试等数据,投资人在做投资决策前,会参考改完网站上的大数据。

另一家名叫Granify的美国数据公司,能实时监测与它对接的各电商平台上的消费者在网购过程中的每一个细微行为,Granify通过每秒监测400多个变量来理解并预测用户的下一步行为,一旦决策引擎判断某种行为可能会阻碍购买,就会自动弹出干预信息或给出优惠诱惑。

从收集的海量数据中找出过去的规律,并从规律中猜测未来的可能方向,是大数据的价值所在。企业面对的情况不是数据太少,而是太多,因此底层数据收集和处理的自动化很重要,让机器去学习完成这项工作。实时自动收集用户数据的能力,以及通过渠道通知用户的能力,是普遍欠缺的。

“大数据要强调闭环。”车品觉对《第一财经日报》记者说,线下消费场景很难实现闭环,但电商平台上,消费者的每一次浏览、点击、下单、评价,都是在线上平台完成的,很容易拿到反馈信息,大数据的反馈机制不是单线,应该是层层反馈。

阿里的移动大数据生态梦

一年多来,马云在国内外众多高端场合下不厌其烦地阐释其IT走向DT(Data Technology)的观点。在内部,他给员工的目标是,让一切业务数据化,让一切数据业务化。后半句的意思是让从大数据中提炼得出的规律和趋势反哺自身业务。

据记者了解,阿里内部和大数据直接相关的部门有两个,除了车品觉所在的数据技术产品部,还有一个是被称为“阿里最神秘部门”的iDST,由《大数据》和《数据之巅》作者涂子沛等人带队。

相比之下,前一个部门着眼于现在,且和阿里的业务线紧密对接,摸索数据对各业务线的帮助;后者更着眼未来,研究大数据的后台算法。在去年由iDST牵头组织的一次数据大赛中,大学生团队的算法甚至超过了阿里自身工程师的算法,后被直接运用到天猫双十一中,当时预计这套算法给平台带来了上千万元的经济价值。

目前,无线化是阿里巴巴的战略转型重心,百川计划、手淘、扫码、物流App等都是移动互联网思路。与PC时代相比,移动互联网下的大数据维度更加复杂,其中最重要的就是位置信息(LBS),对于大数据是一个非常重要的维度。

“手机在手,人人都是数据传感器。”车品觉向记者举例说,手机可以实时发送使用者的位置信息,比如后台通过收集数据能够判断一部手机处于运动状态,但实际是使用者在跑步,还是坐在出租车上?显然,如果选择给这部手机的使用者推送实时广告,应该针对车上这个场景而不是跑步,这就需要通过后台大数据的分析出,跑步是一颠一颠的位置变化频率,坐车是相对连续性的位置移动。

目前,阿里的大数据更多是在内部平台上循环。车品觉说,因为阿里巴巴本身已经具有比较丰富的商业单元,数据部门的工作是先在阿里巴巴这个小生态中摸索大数据产业链的,再将经验泛化到外部,降低商业伙伴使用大数据的门槛。

大数据如何成为未来商业社会的驱动力,大数据能驱动什么在以前不能驱动的?车品觉举例说,现在一些餐馆的排号已经数据化,用餐者的手机上会收到排队情况的提醒,这样他可能会解脱出更多时间到商场去购物,创造新的消费。

在车品觉眼中,与电商和金融领域相比,大数据迄今对人类最大的贡献是在医学领域,比如想在香港大学正在研究将摄像头植入人体的血管,实时素描细胞形态,通过大量监测数据发现可能导致癌症病变的异常,帮助人做出早期判断。

关键字:数据传感器半成品数据清洗

本文摘自:一财网

x 大数据生态链需要“半成品”提供者 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据生态链需要“半成品”提供者

责任编辑:editor004 作者:关健 |来源:企业网D1Net  2015-06-09 21:26:00 本文摘自:一财网

大数据生态中包括各种角色分工,每家公司都想从源头收集做到最后的数据应用,是不现实的,门槛太高,国内市场缺少专门做“数据半成品”的中间层角色,而美国一年来已经涌现出不少这种做数据中间层的创业公司。

“手上有鱼翅了,你让他做一个佛跳墙,他做不出来。”喜欢粤菜口味的香港人车品觉,这样形容大数据的价值(鱼翅)以及企业目前对大数据的挖掘和应用能力(烹饪佛跳墙)。在他看来,大数据挖掘就像做菜。

大数据里潜藏着巨大的宝矿,甚至被马云视为未来商业社会的石油和经济驱动力,仿佛企业(特别是互联网公司)现在不谈论大数据就是out的,但实际真正能将大数据运用到场景中的少之又少。

像通过跟踪一个人敲击键盘的速度和间隔来判断他在购物网站上的目的(是闲逛还是有目的购物)以及购买意愿的程度,背后的大数据发现了电商网站本不知道的内容。

近日,《第一财经日报》在阿里巴巴西溪园区办公室专访了阿里数据技术产品部负责人车品觉,《决战大数据》一书作者。他带领着320人,探索着数据对阿里平台业务的价值,包括双十一期间的数据预判。

车品觉认为,大数据生态中包括各种角色分工,每家公司都想从源头收集做到最后的数据应用,是不现实的,门槛太高,国内市场缺少专门做“数据半成品”的中间层角色,而美国一年来已经涌现出不少这种做数据中间层的创业公司。

国内大数据市场缺少中间层

在阿里巴巴,车品觉所在的数据技术产品部相对是一条很少对外的业务线,每时每刻,阿里平台上有关电商、物流、金融等各个业务线的数据汇聚到这里,有人做数据准备工作(提炼底层数据),有人是数据产品经理,还有一部分是数据分析师,各自分工明确,数据的收集、提炼、分析、整合、算法、应用等,自身就好比一个大数据生态链的迷你版本。

改成: 数据的收集、存储、刷新、整合、辨识、关联、分析、应用等,自身就好比一个大数据生态链的迷你版本。

双十一当天在阿里园区报告厅里的动态数据大屏就是这个部门做的。2014年的双十一,车品觉手下的员工不再像前几次双十一那样全员通宵达旦地紧盯后台,很多人早早回家睡觉了,因为前期准备中已经做好了各项数据产品和交易预判。

在美国,有一家基于LBS的创业公司,它具备的能力是,当你告诉它任意一个地址,它能反馈这周围都有什么业态。后来,这家公司把这种大数据中间层(半成品)产品卖给了苹果公司,用于增强后者的地图功能。

车品觉说,今年类似的围绕大数据中间层的创业公司在美国大量涌现,存在于农业、医疗、物流等通行业中,他们为大数据的应用场景提供数据加工的半成品,这其中隐藏着巨大的商机。

但国内的大数据生态链缺少的就是这种中间层公司。“底层数据的收集和筛选是一项很苦的活儿。”车品觉说,大数据的分析应用就像餐馆做菜,不是每道菜都从初始原材料做起,需要有人专门提供半成品,数据分析师通常需要花费80%甚至更多的时间在数据清洗和准备阶段。

像研究天气与零售的关系,交通对物流的影响等,这些大数据背后都蕴藏着商业价值。美国有一家专门收集工作岗位与年薪信息的网站Glassdoor,越来越成为投资人的新宠。因为该网站汇集了大量有关雇主评价、职场吐槽、招聘面试等数据,投资人在做投资决策前,会参考改完网站上的大数据。

另一家名叫Granify的美国数据公司,能实时监测与它对接的各电商平台上的消费者在网购过程中的每一个细微行为,Granify通过每秒监测400多个变量来理解并预测用户的下一步行为,一旦决策引擎判断某种行为可能会阻碍购买,就会自动弹出干预信息或给出优惠诱惑。

从收集的海量数据中找出过去的规律,并从规律中猜测未来的可能方向,是大数据的价值所在。企业面对的情况不是数据太少,而是太多,因此底层数据收集和处理的自动化很重要,让机器去学习完成这项工作。实时自动收集用户数据的能力,以及通过渠道通知用户的能力,是普遍欠缺的。

“大数据要强调闭环。”车品觉对《第一财经日报》记者说,线下消费场景很难实现闭环,但电商平台上,消费者的每一次浏览、点击、下单、评价,都是在线上平台完成的,很容易拿到反馈信息,大数据的反馈机制不是单线,应该是层层反馈。

阿里的移动大数据生态梦

一年多来,马云在国内外众多高端场合下不厌其烦地阐释其IT走向DT(Data Technology)的观点。在内部,他给员工的目标是,让一切业务数据化,让一切数据业务化。后半句的意思是让从大数据中提炼得出的规律和趋势反哺自身业务。

据记者了解,阿里内部和大数据直接相关的部门有两个,除了车品觉所在的数据技术产品部,还有一个是被称为“阿里最神秘部门”的iDST,由《大数据》和《数据之巅》作者涂子沛等人带队。

相比之下,前一个部门着眼于现在,且和阿里的业务线紧密对接,摸索数据对各业务线的帮助;后者更着眼未来,研究大数据的后台算法。在去年由iDST牵头组织的一次数据大赛中,大学生团队的算法甚至超过了阿里自身工程师的算法,后被直接运用到天猫双十一中,当时预计这套算法给平台带来了上千万元的经济价值。

目前,无线化是阿里巴巴的战略转型重心,百川计划、手淘、扫码、物流App等都是移动互联网思路。与PC时代相比,移动互联网下的大数据维度更加复杂,其中最重要的就是位置信息(LBS),对于大数据是一个非常重要的维度。

“手机在手,人人都是数据传感器。”车品觉向记者举例说,手机可以实时发送使用者的位置信息,比如后台通过收集数据能够判断一部手机处于运动状态,但实际是使用者在跑步,还是坐在出租车上?显然,如果选择给这部手机的使用者推送实时广告,应该针对车上这个场景而不是跑步,这就需要通过后台大数据的分析出,跑步是一颠一颠的位置变化频率,坐车是相对连续性的位置移动。

目前,阿里的大数据更多是在内部平台上循环。车品觉说,因为阿里巴巴本身已经具有比较丰富的商业单元,数据部门的工作是先在阿里巴巴这个小生态中摸索大数据产业链的,再将经验泛化到外部,降低商业伙伴使用大数据的门槛。

大数据如何成为未来商业社会的驱动力,大数据能驱动什么在以前不能驱动的?车品觉举例说,现在一些餐馆的排号已经数据化,用餐者的手机上会收到排队情况的提醒,这样他可能会解脱出更多时间到商场去购物,创造新的消费。

在车品觉眼中,与电商和金融领域相比,大数据迄今对人类最大的贡献是在医学领域,比如想在香港大学正在研究将摄像头植入人体的血管,实时素描细胞形态,通过大量监测数据发现可能导致癌症病变的异常,帮助人做出早期判断。

关键字:数据传感器半成品数据清洗

本文摘自:一财网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^