探索大数据新进展

责任编辑:wendy

2013-08-04 09:30:37

摘自:东方财富网

大数据时代,运营商可以提供用于云服务的数据融合技术、海量数据挖掘技术和大规模分布式技术。在线数据的爆炸性增长,同时基于这些海量数据的存储技术、挖掘技术、计算技术、分析技术

以智慧为聚焦点的大数据

人们对大数据认识水平,当前处在什么阶段?我简单地概括为,知道大数据不是什么(不是数据大),但不知道它是什么。这是我在主持今年大连软交会上的大数据创新论坛时,做出的一个基本判断。

今年以来,大数据的定义越来越多,但内涵并没因此而越来越清楚。带着诸多疑问,我希望听听专家的最新见解,看看在探索大数据“是什么”方面,有什么新的进展。

对大数据的新想法:智慧,也许是正解?

听了IBM、英特尔、VMware等专家的演讲,一个突出感觉,是大家都在把习以为常的大数据概念,说成不是大数据。例如,大家异口同声说大数据不是HADOOP,或主要不是HADOOP,或不光是HADOOP。说这话的行家,其实都是干HADOOP的。初听起来,感到非常意外;琢磨话里的话,似乎大数据背后,有一个“道可道,非常道”的东西。说出来,是的也变不是了。尽管专家们一致认为不必死抠大数据这个概念,但明显大家又都在探讨大数据到底是什么。

我在会上提出一个观点,认为之所以产生这种状态,或许是因为大家看大数据的角度有问题。从数据这个角度解大数据,是客体的角度。光从客体角度解大数据,缺点是难以聚焦,因为数据本身并没有告诉我们它们的存在是为了什么。好比光从石料的角度看罗丹的雕塑《思想者》,难以看出为什么有的石料有用,有的石料没用。

所以我建议人们换一个角度,从主体的角度来看什么是大数据,也就是从大数据到底解决人的什么问题这个角度,来看它是什么。这样看的结果,赫然发现大数据映射在主体这面屏幕墙上的影像是:智慧。这就好比心中有了“思想者”的形象,才知道石料取舍的所以然。这时大数据这个“石料”叫什么,是3V,还是4V;是HADOOP,还是流式计算等,就不那么重要了。

这个方向上的思考具有现实意义。许多专家都在提大数据的应用导向,就是在从客体供给导向,向主体需求导向转。不这样转,就成了为大数据而大数据,为石料而石料,最后把要解决的问题丢了。这样的大数据,雕出来一看,思想者没了,成了一地碎片,如房地产、偷税漏税或骗钱。

智慧又是什么?

现在我们把大数据起个主体角度的外号,叫智慧。接下来要想的是:智慧是什么?

最有启发性的思想火花,不是出现在会场上,而是在大连的广场上。我与IBM中国开发中心首席技术官毛新生,每年都要走同一条路,过同一个人行横道,进同一个门,上同一个电梯……,年复一年,用这几分钟时间迅速交流一下彼此这一年的思想。

我先跟毛先生说,上午我讲大数据在于智慧的计算,你不在。这不是给你们IBM做广告,而是我真的认为大数据的关键在智慧。毛先生的说法,给了我一个意外的启发。他大意是说,智慧的计算叫不叫大数据这个名字并不重要,IBM一直以来一直探索的是计算的本质。智慧的计算不光是数学计算,还包括感性的计算。

我马上反应过来:计算的本质问的是“智慧是什么”这样的问题。从计算角度讲,是要解图灵提出的人工智能问题。从图灵角度看,计算既是抽象的,又是感性的。现在的计算机网络,走到谷歌单纯数学算法的死胡同了,我开玩笑说,一见钟情也是一种算法,是感性直觉的算法。毛先生认为,在将来的企业整合(enterprise integration)和情境加速(context accumulation)中,人们的关系将从交易变为交互体验,转向了感性,其中蕴育着对算法突破的需求。

后面的话,我们都没有说,但那是不言而喻的:大数据只不过是对人工智能的阶段性探索,是一个过客,它在根子上是要回到图灵,对前一段数学算法所走的弯路,从人工智能高度进行拨乱反正。我们为什么需要HADOOP,不是因为它长得像一头大象。而是因为异质性,正是数学同质性算法的一个反方向。数据的非结构化只不过是形式,我们要进行的是对异质性的探索。只要抓住了所以然,是不是HADOOP,真的变得不重要了,虽然HADOOP一如既往地重要。

我提出了我对“智慧是什么”的人文角度的解读。我认为智慧是针对意义来说的,而意义可以当作价值的反义词(特殊-一般,异质-同质层面上的反义词)来看。洞察就是突破语形达到语用,突破价值到达意义。因此才需要通过情境(语用)的方法来把握。这时达到的,是这个世界表层(功能层、价值层)以下的更深层(意义层).

我讲了一个我听说的笑话:某企业老板挣了19亿之后,英年早逝。老板娘带着钱嫁给了老板的司机。司机感叹,以前一直以为是给老板打工,现在才知道是老板给我打工。这说明的就是价值(钱和GDP)与意义(快乐和幸福)的不同。大数据使人们进入到追求意义的时代,解决有钱但不快乐的问题。

我们不禁要问:大数据所为何来?就是要在人的价值实现中,用人的意义,统摄人的价值。去掉价值中无意义的部分(例如增加GDP但无意义的污染和浪费等),留下有意义的价值。去掉不智,留下智慧。我们搞大数据,不是为了骗银行的钱,不是为了到祁连山上去给机器降温……而是为了洞察深藏在价值表面背后的意义,把握理性背后的体验,使我们的存在和价值更加一致于我们的认同。

智慧:以大数据建立世界

明白了智慧是针对什么说的,接下来再看我们所做的大数据工作是什么,就变得清澈起来。

我们今天所从事的大数据,只不过是人类第三次创世纪工程的一个片断。整个工程的“目的”,是在建设一个新的维度,使意义投胎到世界的数据体上。

人类曾投了三次胎。第一次投胎的胎体是世界1。这是实体的世界,它以实体为中介存在。这个世界以功能和使用价值,承载人们生存的存在;

第二次投胎的胎体是世界2。这是价值的世界,它以货币为中介存在。这个世界将一切转化为等长的社会必要劳动时间,即我们平常所说的价值。人们衡量一切事物的尺度,就是它“有没有价值”。这个世界以价值,承载的是人们发展的存在

第三次投胎的胎体是世界3,这是意义的世界,它以网络为中介存在。这个世界以意义,承载人们自我实现的存在。要在以前的实用、有价值的基础上,追求认同。

价值的世界是一个时空标准化的世界,它无法准确呈现意义的存在。今天人们发明人际网络、物联网,都是在给意义一个适合的呈现空间。使事物隐含的快乐和痛苦的潜在含义,在我们创造的每一分价值和使用价值中,对我们澄明地呈现。大数据就是意义发现。通过意义的发现,指导价值的取舍(让有意义的价值实现,让没有意义的价值湮灭).

仔细观察就会发现,大数据的背景是语义网的出现。语义网最终将把社会网络和物联网都变为智慧网络,也就是专门让意义得以呈现的网络。这与人们在世界2中发明货币这个呈现中介,让价值从在实体中不可见变为直接可见,是一样的原理。大数据让意义从在钞票中不可见,变为直接可见。

世界3的诞生,并不意味着世界2和世界1的消失。世界3只是相当于世界2和世界1的照明系统。传统经济相当于一个摸黑干活的系统,所谓“摸黑”就是指人们不知生产的哪些东西最终有需求,哪些没有,为此付出巨大的交易费用(往往占GDP一半以上),实现供求平衡(即价值吻合于意义)。智慧化相当于提供一个照明系统,让传统货币经济与实体经济不再摸黑创造交换价值(世界2的价值)和使用价值(世界1的价值),通过大数据照亮意义,即洞察最终需求,只创造那些有意义的价值和使用价值。所以人们经常比智慧比喻成明灯。这是智慧化对于传统经济的意义。

从这个意义上说,大数据与传统经济并不是对立的关系,而是一个递进发展的关系。大数据的应用,本质上就是在世界2、世界1中寻找并呈现意义这种应用。

智慧产业化与产业智慧化

如果大数据不是为了骗银行贷款,不是为了搞房地产,而沿着应用导向,健康向前发展,它最终形成什么样的产业机会呢?在大数据创新论坛的最后,我专门做了一个大数据时代的智慧产业的报告。对于新的产业机会,我概括为智慧产业化与产业智慧化。

在农业时代和工业时代,并不是不存在智慧,而是智慧不能成为所在时代的时代特征。例如三国时代,智慧是以小生产方式,存在于诸葛亮等少数人的头脑中。庞统被一箭射死在落凤坡,团队智慧就失其大半。智慧只是附属于实体,难以专业化地独立发展。

在信息时代的华彩乐章出现的大数据,使智慧形成产业化的发展,产生一系列智慧产业。例如,ICT产业相当于专门生产意义的胎体,提供世界3的技术实在,营造意义的中介。内容产业、文化产业、咨询产业等,提供可供人们认同的意义本身,指导人们有意义地生产、生活。

产业的智慧化,则是指各行各业的智慧化。表现为通过大数据以及后继的人工智能,洞察和把握由最终用户赋予的意义,以此指导价值的创造。它又可以分为以下几类:

一是推动业务转型,通过分析即服务(AaaS),从企业的核心BI一直到一线的CRM,广泛配置智慧能力,实现情境定价和人单合一。

二是数据业务主营化,即各行各业的第二信息部门从成本中心,转成利润中心,数据业务从副业转变为主业,从而实现更有意义的价值创造。

三是智慧应用兴起。WebAPP、A2A(应用对应用)等智能感应的应用得到迅速的发展。大数据最终将使人们仅凭借心灵的碰撞,就会闪出智慧应用的火花。

智慧城市:照亮城市的不是路灯,而是智慧

今天的中国正在掀起一个建设城市的热潮。据说中国要完成城市化的建筑工作量,相当于新建七个欧洲。这是人类历史上最大的价值创造工程。但创造的价值有多少意义,还不确定。因为城镇化过程,面对黑暗和光明两条路。只用路灯照明的城镇化,是黑暗之路,它照亮的只是砖头瓦块的实体,意义仍处在遮蔽状态;用智慧照明的城镇化,才是光明之路,它将意义从遮蔽状态变为澄明状态,使创造的价值真正造福民生,而不再为GDP而GDP.

智慧城市就是借助大数据等意义照明系统,使功能建设与价值创造更有意义针对性的城市。传统的城市化建设,修建了许多基础设施系统,如水电气系统、排污系统,但始终有一个缺失,就是没有建立现代化的意义输通管线。上情下达,下情上达,信息交互的渠道是不畅的。这样的城市化,在欧洲中世纪曾被称为黑暗时代,有违人性的现代化。

以大数据的思路建设新型城镇,就要下大力气建立城镇的意义照明系统。意义照明系统的作用,是在做事的宗旨(即意义)与做的事(功能建设)与功(GDP增加)之间建立专业化的联接通道。也就是在为人民服务的口号与为人民办的实事之间,建立相互印证的桥梁。目前我们不是没有这种的通道,而是这样的通道与电网系统等比较,十分业余简陋,落后于下水道的建设水平、路灯的建设水平等。企业有专业的CRM系统,社会的CRM系统却是业余的。

21世纪的意义照明系统与工业时代的意义照明系统不同。工业时代的意义照明系统本质上是简单系统,简单主要表现在结构的简单上、无论东方还是西方的系统,都具有自上而下、层级分割,他组织、他协调的中央控制的典型简单系统特征;还表现在时空效能上,无论东方还是西方的系统,时间上都需要四年以上的迟滞、空间上都需要中心与外围之间的大量中间阻梗,呈现出意义响应上的低效能。

21世纪的意义照明系统本质上是复杂系统。复杂主要表现在结构上的自下而上,扁平化,自组织、自协调的末稍决策;在时空效能上显示出灵活快速响应的特征。适合把政府做不了、做不好和不该做的事,交给社会,以自组织、自协调的复杂系统的方式来分担,从而实现复杂社会系统的和谐。

中国处在工业化与信息化融合阶段,所谓的中国特色,不仅应表现在补工业化的课,建立和完善适应传统国情的简单系统(它仅相当于修建城市主干道的意义照明系统);而且应表现在将信息化融入工业化,在复杂系统条件下,建立快速全面响应的意义适应系统(相当于建立起通向每个街道、胡同、家庭和个人的意义照明系统)。与欧洲中世纪仅仅依靠信仰来解决意义的简单做法不同(相当于只在市中心树盏大灯,但能照多远算多远),大数据建立在语义网络基础之上,可以在中央控制系统外部,以分布式的方式,建立广泛的意义输送的毛细血管,及时让网络中心7天×24小时地了解基层民意(相当于让城市的每个角落都可以照明).

举例来说,兴起已有七年的官员正在各地流行。官员在技术上就具有“7×24”官员互动的特征。正如时评所论:网上电子政务的开通,拉近了群众与政府机关的距离,不需要跨过重重门槛,不需要历经层层阻隔,不需要穿过道道关卡,只需你发我收,领导们就能听到群众的呼声,为更好地解决工作中存在的问题,提供了更有力的保障。

网上宿迁提出“智慧在民间、力量靠群众”,通过网络,问政于民、问需于民、问计于民,充分地汲取最广大的民间智慧,集中网络民智,了解网络民意。网络问政使网民与部门之间可以实现“一对一交流”,最大限度地提高办事效率、解决群众难题。这就是建立智慧城市的意义系统的一个成功实践。

目前的官员还仅限于技术突破,个别突破,如果能成为一种制度,它将成为中国特色政治体制改革的有效突破口。这个中国特色不是特在别的地方,而是创造一种远比4年选一次效能更高的7天×24小时的实时响应系统。它比空谈信仰的作用更大、更实在,因为它可以把一个政府做事的宗旨(意义)与它的服务对象建立实实在在的联接,建立起上下一致的意义的认同。

中国意义认同系统,面临恢复和追赶古代先进水平的艰巨任务。古代意义认同系统,如儒家系统,起码具有上下认同一致的优点,有效抑制了信仰上的犬儒主义(说一套做一套)。仔细分析,孔子建立的未来学系统(提前345年预先准备好社会意义认同系统,2000年一直运维正常)与大数据系统十分神似:第一,都是小世界系统(如修齐治平就是典型的六度分隔和SNS结构),具有复杂系统自组织功能。第二,都强调宏大叙事与日常生活行为的统一,孔子的风格具有的典型特征,就是见萝卜说萝卜,见白菜说白菜,但从来不离开“仁”。不象工业时代的东西方一些政治精英,满口宏大叙事,一到实事就不闻不问不灵;只会把鸡蛋放在一个篮子里才安全,一旦把鸡蛋放进多个篮子就不安全。

大数据在其中的作用,是实现意义赋值系统的专业化。从以人为本角度看,智慧城市到底智慧不智慧,关键看它的意义赋值系统专业不专业、有效还是无效。习近平讲:人民对美好生活的向往,就是我们的奋斗目标。就等于说,人民才是意义的赋值者。离开人民群众,就没有意义;数据离开了意义,就没有智慧;没有智慧,建设的智慧城市建成后一定是愚蠢城市,与民生实际相疏离。

实现意义赋值系统的专业化,一个重要方面,就是要建立专业化的官民互动渠道,满足公众参与的基本要求。例如具有如下的功能:(1)渠道多样化,满足用户各种互动需求。(2)及时处理、反馈公众意见,形成真正的互动。(3)策划好的选题,保证参与内容和政府工作相结合。(4)定期将互动情况进行总结报送。

电子政务去年以来,出现了一些新的进展。较为突出的是服务转型,表现为在平台化的基础上,政府服务与社会服务正在趋向结合,大数据可以在其中发挥作用。

如果大数据只服务于城市的下水道系统,只能使一个局部变得更有意义,但如果能使权力中心摆脱人治的小生产状态,实现复杂系统条件下的政府管理与社会治理协同,让为人民服务、为人人服务从上到下变得澄明起来,功莫大焉。

基于云端的大数据崛起

大数据是未来的行业发展趋势,其发展势头已势不可挡,而Hadoop作为更大规模分布式计算和存储离线处理集群的代表,在今年更是红遍了全球。

无可否认,大数据正在成为改变人们生活的重要因素,而大数据和云计算的整合也在如火如荼地进行中。

从定量、结构的世界,到不确定、非结构的世界。这个转变,使我们得以了解真实信息,提高决策水平,当社会对自然的数据有较为完善、随时的分析能力时,我们对事件的把握及预测能力便增强。以云计算为基础的信息存储、分享和挖掘手段为知识生产提供了工具,通过对大数据分析、预测会使得决策更为精准,而对于许多企业而言,数据正成为在商战中取胜的决定性要素。

日前落幕的第十一届大连软交会“2013大数据创新论坛”,以大数据的分析及服务为主题,邀请了来自Intel、微软和IBM的高层专家,分享了对大数据技术的见解,共同探讨大数据生态系统的构建。

中国有着庞大的人群和应用市场,复杂性高、充满变化,如此庞大的用户群体,构成了世界上最为庞杂、最为繁复的数据。解决这种由大规模数据引起的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。

IBM “智慧的计算”引领方向

  作为论坛当日的一大亮点,IBM中国开发中心首席技术官毛新生在以“智慧的计算”为主题的演讲中提出:大数据并不是Hadoop, Hadoop只是进行大数据分析的一个很小的分支,大数据分析是非常多样化的领域,每一个领域自身数学模型和数学属性,这些模型和属性需要开发者去开发领域相关的算法,然后将这个算法映射到一个可以进行大规模分布的机制上,这个机制往往要利用云计算基础设施达成。

作为大数据领域的领导者,IBM正在利用领先方法论和全面大数据技术帮助企业重新思考已有的IT模式;助力企业进行基于这场信息革命的业务转型,获取竞争机遇和不可估量的商业价值。同时,IBM作为目前业界唯一能够集咨询、服务、软硬件综合实力,提供端到端全面整合解决方案的厂商,相关产品和服务覆盖了大数据及分析相关领域的各个阶段、各个领域;IBM的大数据实践已经深入到包括中国在内的全球市场的各个行业,包括电信、金融、医疗、零售、制造等众多客户已在IBM大数据平台及大数据分析等技术和理念支持下获得收益。此外,IBM还推出了一套以成果为导向的组合产品解决方案,包括欺诈预测、财务运营和客户服务三大核心能力。这套解决方案广泛汇集了IBM的智慧资本,包括软件产品、基础架构、研究及咨询服务。

针对企业大数据方向开发者,IBM推出了多款产品和技术,大力提升了其分析产品的加速性能,简化了开发和运营。新版本企业级Hadoop产品InfoSphere BigInsights可以利用现有的SQL技术,更便捷地开发应用组件。兼具安全性强和高可用性特点,新版BigInsights能够更加契合企业部署需求。新版流计算软件InfoSphere Streams在实时分析的开发和部署上进一步增强了操作的简易性。新版关系数据库管理软件Informix包含TimeSeries Acceleration,能够适用于智能仪表和传感器数据的运行报告和分析。

英特尔软硬协同、体验至上

“大数据正在深刻地改变软件行业、IT产业,以及人们生活的方方面面。”英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理何京翔博士表示:“产业正在重构。我们希望与广大产业链伙伴和开发者分享英特尔大数据技术平台和计算解决方案,推动构建本地‘端到端’的大数据生态环境,共同迎接智能城镇建设中日益苛刻的大数据挑战。”

目前,英特尔的软件支持已经扩展到整个软件栈,从平台硬件、固件、虚拟机、云计算到操作系统、开发工具、中间件和应用程序,帮助广大产业链伙伴和开发者释放创新潜力,革新用户体验。以英特尔针对大数据的开放架构核心产品线,配合英特尔Hadoop分发版,可以实现“软硬协同、体验至上”的创新效果。例如,利用英特尔至强处理器平台对网络和I/O技术所做的优化,与英特尔Hadoop分发版进行强力组合,以往分析1TB的数据需要4个多小时漫长等待才能完全处理完毕,现在仅需短短的7分钟即可完成,极大地提升了大数据“智能”的意义。

英特尔Hadoop目前已经有了广泛的应用案例,包括智慧城市、电信、金融、医疗等行业都产生了用户。在谈到具体案例的时候,苗凯翔博士指出在英特尔Hadoop发行版软件的应用领域,中国比其他国家是先迈出了一大步,走在了世界的前列。以电信行业为例,英特尔Hadoop发行版已经被中国联通,用以进行历史账单及流量的查询与分析。正是由于客户的强烈需求,使得英特尔Hadoop这一原本在英特尔作为创新与尝试性的项目最终变成实际的产品出现。

通过与本地合作伙伴的携手努力,英特尔正在将大数据技术应用于智慧医疗的创新。英特尔亚太地区研发有限公司数据中心软件部大数据解决方案经理王晓栋介绍了在过去一年中与用友在UEP框架下实现的合作,主要是基于英特尔x86集群+x86综合解决方案,来尝试处理现在在医疗中的问题。例如医生查询病人病例,以前可能要拿病例本才能查到,而随着整个医疗系统在大数据时代的升级,所有医疗病例都集成在英特尔大数据平台上,使其查询速度、处理速度都达到顶级的水平。在过去一年,双方在区域性、大型电子健康档案和区域性的医疗质量分析方面均进行了不同程度的尝试。

从IT硬件系统,到数据管理应用,再到数据处理和分析软件领域,英特尔都拥有广泛的合作伙伴和健康的生态系统,通过合作伙伴间的紧密合作,已能够向用户提供适用于大数据应用,或针对此应用进行了进一步优化的服务器、存储设备和网络设备,以及能与这些设备实现无缝对接、更符合大数据应用需求的数据管理和数据分析软件。

大数据处理任务对于开放架构平台的倚重,让英特尔在这一领域获得了越来越多开发者的关注。作为全球领先的开放架构平台最核心部件——处理器平台的提供商,英特尔首要的任务就是要打造适用于大数据应用的“芯”,而后帮助开发者围绕这一基础创新打造可承载大数据应用的基础设施。英特尔还计划在其上的数据组织与管理层,针对大数据的分发和管理需求提供针对英特尔平台优化的Hadoop产品和服务;在分析与发现层,提供针对客户端与服务器端算法开发的支持,以满足大数据计算所需的性能与规模要求;在决策支持与IT服务层,则将联合生态系统内的合作伙伴,提供更为优化的可视化应用体验。英特尔所有与这些规划相关的具体策略,将随着大数据技术、应用和市场的发展逐步深化、细化。

微软携甲骨文漫步“云端”

结合对大数据本身的认知和微软自身强大的产品组合,微软可以为用户提供一个端到端的大数据解决方案。简单来说,就是后端以新一代SQL Server 2012为基准平台,将大数据管起来,然后在中端以数据集市为依托,配以丰富的数据应用,最后在前端以丰富的界面形式展现数据分析的结果,完成数据的汇总——应用与分析——结果呈现的完整流程。

为帮助企业快速采用其大数据解决方案,微软将同时在ows Azure 平台和 ows Server 上提供 Hadoop(在前者上用作基于云的服务,在后者上用作内部部署的分布)。并且有非常多的第三方针对Hadoop的应用工具,能够在这个平台上做到更好的分析、更好的视觉化的工作。微软大数据解决方案还支持Mahout等通用的第三方工具与框架,通过Hadoop流,支持C++、C#、Python、Ruby和Pearl语言的定制挖掘算法。

去年9月份,微软跟中国电信天翼平台达成合作共识,他们把门户网站的服务、灾备服务都建立在ows Server上,这样便整合成了一个非常完整的“云”操作系统。对于客户来说,这个系统将带来了相当大的价值,它能够把你所有的应用、所有的运维场景在线上和线下更好地管理起来。从整体角度来说,云的管理系统能够帮助IT人员解决一系列操作场景。

为了让更多初创企业使用微软公有云服务,微软大中华区副总裁兼市场战略部总经理、微软大中华区首席云计算战略官谢恩伟表示,公司已在华启动了云加速器项目,免费为新创企业提供ows Azure服务,而目的也是进一步推广公有云服务。ows Azure开放、可靠、易用的平台服务大幅降低了初创企业系统开发及运营成本,帮助初创企业快速在全球范围内开展业务,并为全球用户提供一致卓越的用户体验,使初创企业集中精力于核心业务开发,加速业务成长。目前第二期项目已接近尾声。

此外,吸引广大开发者眼球的好消息还包括HTML 5网页app、Apache Cordova/PhoneGap 和 ows Phone 7.5的开发者,现在可以用Azure作为服务支持。而可以享有这个权利的移动端浏览器包括IE8以及“现行版本的Chrome、 Firefox、 Safari和2.3以上的PhoneGap。”

近日,有国外媒体报道称,甲骨文与微软公司宣布在云计算领域展开深入合作。其中微软云平台ows Azure将全面支持Oracle数据库、Java、Weblogic和Linux。通过与甲骨文的合作,微软能够给ows Azure平台的客户提供更多的部署选择。但对于Azure平台应用在甲骨文和微软云上的表现具体会如何,目前尚不得而知。

三巨头八仙过海各显神通

2012年,从整个云计算解决方案ITBrand排行榜上看出,IBM、微软、英特尔虽然在排名上有细微波动,但一直稳居前三位。

云计算技术是目前解决大数据问题集最重要有效的手段。云计算提供了基础架构平台,大数据应用在这个平台上运行。大数据是未来的行业发展趋势,其发展势头已势不可挡,而Hadoop作为更大规模分布式计算和存储离线处理集群的代表,在今年更是红遍了全球。英特尔一方面准备了全面的、端到端的、跨越了凌动、单路双路及多路至强处理器产品的核心硬件支持,另一方面由英特尔中国团队领衔开发的Apache Hadoop软件的英特尔Hadoop分发版不但可提供开源版本所不具备的强大技术支持,还针对英特尔架构硬件平台进行了充分优化;IBM的优势在于其信息管理平台、信息整合与治理、分析能力,以及平衡配置的IT基础架构;微软希望将Hadoop集成到ows系统中,在ows Azure、ows Server、SQL server 2012上全面支持Hadoop. 在大数据分析领域,虽然暂时面临技术人员匮乏的状况,但现今越来越多的人开始学习Hadoop,企业也在鼓励和培养技术人员学习Hadoop。广大开发者应抓住大数据机遇,选择更适合的平台技术,借助最优的解决方案,利用大数据开发出更智能、更个性化的新一代应用,并最终实现应用经济的转型升级。

运营商的大数据机会

随着互联网发展深化到移动互联网阶段,运营商的危机日渐明朗化,但是危中有机,运营商的机遇同样显现,这就是大数据。

互联网的发展、OTT业务的兴起对电信运营企业造成了很大的冲击。随着互联网的发展深化到移动互联网阶段,运营商的危机日渐明朗化,但是危中有机,运营商的机遇同样显现,这就是大数据。移动互联网使云计算技术与应用得以兴盛和落地,而大数据是对云计算的深化,二者密不可分。在云计算和大数据应用的发展上,运营商相对互联网企业有一定的比较优势,利用好了,找准了发力点和突破点,运营商便可以在未来很长一段时期内在移动互联网产业的发展中占据一席之地。运营商发展云计算的先天优势是其在电信时代所积累的遍布全球的IDC(数据中心)和庞大而详细的用户数据(包括身份数据和行为数据),而且都是电信级的质量和品质。

目前运营商的IDC不仅满足自身业务的需求,也为互联网企业提供相关租赁、托管等服务。现阶段运营商的IDC是中国大数据产业发展的重要基础设施支撑,但移动网络的接入及数据量的暴增和频繁的数据运算与交互,也对运营商的IDC提出了严峻的挑战,运营商必须对数据中心进行重新规划部署和更新迭代,以赶上这一波大数据发展的浪潮。运营商的设备、服务质量较高,但同时成本也居高不下,这在电信时代不是问题,但在互联网时代却难以跟上形势。降低成本,保证合理的质量,并进行市场普遍定价,这是运营商必须考虑和解决的问题。

中国运营商的发展已有十数年,且用户数量巨大,几乎人人都是三大运营商的用户,难出其外,在这一点上目前互联网企业还难以望其项背。运营商利用好这一优势,打好时间差,先发制人,可以获得先发优势。否则,随着人们的行为越来越多地发生在互联网公司端,互联网公司搜集到的数据越来越全面,运营商的优势将不复存在。所以在数据的搜集上,运营商已经占了先机,但现在还需有针对性地搜集各种不同类型的数据,毕竟运营商的应用还较为单一。

当好云营商

在云计算上,运营商有很大的机会,要抓住机遇,快步赶上,当好云营商,做好云运营。云计算产业的发展主要有3个方向:IaaS、PaaS、SaaS。其中,运营商在IaaS上较强,积累较多,而在平台和软件上则较弱,运营商在这方面可以加强,带来突破。在平台上,运营商较弱。从各国运营商的云计算开发中,可以看到平台已经不光是亚马逊和谷歌这样的互联网公司才会关注的问题。在云计算的发展中,平台才是王道,得平台者,得云计算半壁。运营商应与开发者合作共赢,从以自己单独运营为主逐渐转向专注提供开放的、低门槛的开发平台和环境,汇聚广大开发者共同开发。

云计算对运营商数据中心建设、提供计算服务、作智能管道支撑、为终端及应用开发者提供服务等各方面都起到了升级换代的作用。运营商的产业战略布局可以管道为核心,充分利用独有的网络管道资源;以开放平台为基础,打造良性生态环境;以应用为突破,带动增值业务发展,最终形成自己的核心竞争力。运营商发展云计算,不能仅停留在云计算本身上,也不能仅停留在云计算基础设施建设上,而是要专注于云计算应用,使其落地生花。

运营商长期积累的数据中心优势明显,但仍有一些地方需要改进和优化。运营商IDC众多,对带宽绝对控制,有国有资产的公信力,无论发展公有云、私有云还是专属云,均具备优势。运营商星散各地的IDC资源是大多数起家不过十数年的互联网公司无法企及的,应充分利用。随着科技产业发展的加速,政府正在利用互联网的新革命时代大幅度调整产业结构,重点扶持战略性新兴产业。不论是物联网、三网融合还是云计算,都将催生大量的新兴应用,而为应用提供保障的IDC自然也必会迎来新的发展。数据中心是运营商的突出优势,电信产业发展至今,已经变得高度依赖于差异化和数据化。尽早布局基于IT的云,才能使IT数据服务成为运营商增值服务的加速器,进一步发展到最终面向应用服务,提升用户体验和服务精细化过程。与此同时,目前我国电信级云计算建设基本仍是套用IDC的模式,追求IaaS的规模。粗放的IDC模式套用在云计算上,对于整个移动互联网产业链会产生不良的影响。运营商对此应给予高度的重视,用互联网的思维对待和建设IDC,以长远的战略眼光和思维驾驭IDC的建设。

软件实力是未来支撑管道企业的根基。整个ICT产业的发展趋势是利润重心从硬件向软件、软件向服务转移。现在运营商虽然从事服务业,但软件较弱,运营商现在的软件都是找别人开发的,但软件是一种独立的能力,因为没有内功扛不住风险,也不能保证用户体验。软件能力缺失会导致后续竞争上的极大劣势。运营商要跟上趋势,瞄向企业商务服务业务,而不只是简单地作为IT服务。当务之急是在能够产生利润和客户效果之处投入软件力量。运营商推出的套餐五花八门,令人眼花缭乱、不知所措,这是没有软件支持的结果,是服务小生产。运营商的服务要深化,简单靠套餐已经难以适应当前的发展,应将云计算引入服务,云计算的重要特点是自己不提供服务,而是调动别人提供服务,运营商应调动外部力量为自己的用户服务,然后与其分成,而非与自己的营业厅分成(自有核心业务减少合作,平台业务加强合作).

在云计算环境下,运营商需要对用户进行重新定位,从使用移动终端的用户变革为发生通信并实施数据应用行为的用户,即云计算用户。云计算最终要落实到人上,云计算的主体和客体都要以人为主。运营商在云计算的数据网络时代,对用户的定位比时下传统的电信用户定位范围更大,不仅包括使用SIM卡的移动终端用户、使用3G等制式的无线用户、有线电话或固网用户,还包括非自然人形态存在的机器类用户。

从数据大到大数据

电信时代,凭借着国企、一定程度上的公共服务企业、国家安全命脉、垄断地位及国家电信管制政策的实名制,运营商积累了大量的优质数据。但在电信时代,其价值一直未被发现,也无需发现。移动互联网大数据的兴起,使这些数据反倒可以成为运营商咸鱼翻身的机遇。目前运营商只是数据大,需要将数据大变成大数据,对数据进行充分的挖掘和分析,并从中生发出新的业务形态和价值来。运营商要接受大数据带来的变革性影响,顺应数据业务主营化的大趋势,将数据业务及时转换成自己的主营业务。电信业原有的主营业务是语音业务,数据业务只是辅助性业务。但在移动互联网中,数据业务上升为主营业务,有的甚至可以占到76%以上,而语音业务成为副业。

目前三大运营商中,云计算和大数据发展较快、较好的是中国电信。在6月5日举行的第五届“中国云计算大会”上,中国电信云计算公司总经理王峰对记者表示,目前电信业最热门的三大技术趋势是云计算、大数据和SDN。其中,云计算和大数据是离运营商最近的技术趋势。云计算加速了大数据时代的到来,而大数据将为运营商带来新的盈利空间。王峰表示,运营商拥有丰富的大数据资源,包括数据资源、基础资源和平台资源,这些资源优势是其他企业无法比拟的。不过,这些数据只有经过长期的运营、使用和剖析,才能够真正发挥价值。为此,中国电信制定了三条具体发展思路:构建数据共享服务体系;进行深度的数据挖掘工作,推动业务发展;坚持应用为王,将数据分析结果引入到应用开发,支撑中国电信各项以流量经营为代表的提升用户感知的产品开发,从而为用户提供更好的体验。

数据也是运营商可以突破的方向,但非指流量数据,而是增值数据,特别是基于IT的数据增值业务,基于IT的核心能力。大数据既不属于传统的电信问题,也不属于互联网问题,是新产生的问题。在大数据量下的技术创新介于流量技术和数据业务之间,将来或许比运营商的骨干网还要有价值。

大数据时代,运营商可以提供用于云服务的数据融合技术、海量数据挖掘技术和大规模分布式技术。围绕新核心系统BDS这个中心,形成运营商的网络大脑,进而建立网络数据子系统、用户数据子系统和业务数据子系统。且其IDC有天然优势,不用求人。这一部分,从互联网角度看,也属于运营商最优质的资产,可以成为移动互联网数据核心业务的重要组成部分,甚至是重心所在。

  运营商的数据能力以往都用在内部运维、OSS系统运行保障上,还没有在互联网上大展身手。将来努力方向是完善面向客户的支撑系统,全面提升面向客户的支撑能力。不应局限于传统IDC思路,只把重点放在服务器托管、出租设备等方式上,还需要深入到业务内部,思路向数据方向转变,提高服务的能力。

移动互联前沿的竞争在于除了提供IT服务之外,还要与应用结合起来,提供应用(而非IT运维)的云计算服务。运营商确实在跟进这一块,但问题是用电信基础业务和这些应用直接对接,中间缺少核心竞争力,现在大数据切入到电信和应用中间是提高核心竞争力的重要方式,但数据本身也在发展,云计算、大数据未来的趋势是提高应用能力。要学习IBM,既可以提供IT的运维服务,做数据计算加工获取收入,还有一部分瞄着向企业应用云服务方向发展。应用部分可谓无穷无尽,是真正的财源。运营商若能在此有所突破,将会轻松许多。运营商应形成众多分散应用与集中的基础服务相结合的格局,一旦在基础服务上卡住了位,也便有了竞争优势。现在运营商管道业务总体上是在数据业务这方面,如果加一把力会有一定的优势,但是如果不能及时切分和拉长产业链,就存在着巨大隐患。例如数据采集之后,要把数据业务展开成几个具体的产业;再如数据增值前,可以增加咨询加工服务,再往下是平台业务、很多分散的应用,这恐怕不是运营商一家能够做得到的,可通过合作做大产业。

网络营销的大数据之路

在海量繁杂的数据中用算法挖掘出用户的营销价值,并在合适的媒体上及时达成广告主的营销目标,让广告主、用户和媒体的利益同时得到最大化,是大数据给网络营销带来的新机遇。

大数据并非是一个全新的概念,此前线下也有大数据商业应用的成功案例,如沃尔玛依托自己长年积累的大量的用户消费行为数据,为自己的定价、布点等商业决策提供支持。

然而在线数据的爆炸性增长,同时基于这些海量数据的存储技术、挖掘技术、计算技术、分析技术等各种技术手段的飞速进步,让大数据的应用模式不断创新,大数据成为当下最热门的概念之一。

“在我看来,在线数据量的爆炸式增长及让在线数据得以价值化的一些技术的飞速发展,才是让大数据这个领域在最近几年发展得风生水起的原因。”亿玛总裁柯细兴这样认为。

价值化成大数据核心

“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”哈佛大学社会学教授加里·金对大数据如此评价。

美国互联网数据中心曾指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。有数据显示,Google每月有1000亿次的查询量,Facebook每天有超过3.5亿张的新照片在上传,YouTube每分钟有100小时的视频内容在上传……,这一切都显示出现在的数据量正在呈现海量的、爆发性的增长趋势。

而“互联网女皇”玛丽·米克尔在最新发布的《2013年互联网趋势报告》中指出,当前数字化内容暴涨,正日趋呈现共享化、标签化、可搜索的趋势,如互联网主要应用之一的图片,其上传和共享数的复合年增长率高达200%。以目前在美国非常受欢迎的限时图片分享应用服务Snapchat为例,其2012年10月的信息量只有2000万,而到2013年4月,其信息量已高达1.5亿,增长率远超200%。

在这些暴增的数据量中,有90%是非结构化数据,如声音、图片、影像等,而人们在网上行为所产生的大部分都是此类数据,而这也正是大数据的挑战之一。

“大数据必须具备的特征之一就是数据的多样性要充分,也就是‘数据大’,要能覆盖到海量广泛的数据、标签、行为特征等,否则就没有分析的基础。”柯细兴说。

  业界不少专家都强调过“大数据”并非“数据大”,但若没有“数据大”这个基础,后续的一系列挖掘、计算、分析、应用就将不再存在,可以说,“数据大”是“大数据”的必要非充分条件。

但同样的,“数据大”也并非就是“大数据”,只有让数据产生价值才是大数据的核心。

“大数据的基础条件是数据多样性和实时性,而评判它是否为大数据的唯一标准是它有没有价值,能不能产生数据之外的价值,换而言之就是这个数据有没有用处,用了它之后能起到怎样的作用。”柯细兴表示,“毕竟我们认识到其实数据本身是无用的,只有基于大数据挖掘和商业智能,产生了价值,才是有用的。因此,我们更看重大数据的价值挖掘和价值挖掘下面的商业智能的应用。”

“‘大数据时代’的到来,为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。但同时,‘大数据’也对人类的数据驾驭能力提出了新的挑战。但不管怎样,海量数据已然摆在面前,是机遇必然伴随挑战,关键在于如何应对。”指点传媒CEO曹彤表示。

RTB引领大数据营销

大数据在开源技术的推动下正如火如荼地进入快速发展期,包括底层技术的研究、分析工具的研究、应用方法的研究等等。而无论是学术界、商界还是政府都开始正视这不可阻挡的大数据趋势,思考着如何才能有效地通过大数据手段增加自身的竞争力,如怎样更好地抓住用户需求、更好地服务用户,或是如何更好地为人民服务、增加社会影响力等。

在网络营销领域,一直在追求着精准营销,甚至是用户的一对一营销,未来网络广告会依据大数据所呈现的用户的多维画像而变得越来越精准,广告即为有效信息的趋势将越来越明显。而要达到这一点,就需要对用户的在线行为有更多、更深刻的理解,需要对海量且源源不断的数据加以整合分析,并将结果用于各种决策,为此,不仅需要数据的多样化,还需要数据的可持续性。

“大数据并不是一件一劳永逸的事情,它是一个不断持续、不断变化的过程,需要不断去适应变化,毕竟数据的量越来越多,数据的种类和特征也是千变万化,就需要我们随时调整、随时深入。”哇棒传媒副总经理冯金辉表示。

大数据营销可以说是由媒体、广告主、用户三者共同造就的,用户是数据的源头,媒体是数据的起因,广告主是数据的结果。在海量繁杂的数据中用算法挖掘出用户的营销价值,并在合适的媒体上及时达成广告主的营销目标是大数据带给网络营销的新机遇。

但值得注意的是,并非所有的数据都有意义和价值,在线数据存在着去伪存真的必要性,而判断数据的“真”与“假”不仅需要技术,也需要丰富的实践经验。

虽然在技术上,大数据显得日趋深入和复杂,但它却让网络营销的决策变得简单和有效——大数据正在把营销环节变得模型化和可计算化。通过不同维度数据的整合和分析,营销的决策者可以看到数据中体现出来的用户价值、媒体价值、产品价值。这给能够产生和获得用户数据的产品方和能够整合并挖掘用户数据的营销服务方都带来了很大的市场机遇。

“关键点在于数据的整合分析,如何对大量的不同渠道和维度的数据加以有效管理和分析始终是大数据时代需要精益求精的方向。”地幔集团总裁张伟表示。

在张伟看来,网络营销领域,数据从采集到分析到应用各个环节的都在如火如荼地发展着:给用户提供价值服务的产品是营销渠道;提供数据收集、整合、提炼服务的是营销分析;分析结果再通过营销决策系统及时反馈给营销渠道,反馈的形式可以是产品的个性化功能也可以是营销的个性化广告。大数据的应用正在逐渐影响甚至改变着网络营销的广告模式,比如实时交易广告模式(RTB)的崛起。

“大数据给网络广告带来了巨大的变革,而RTB广告是大数据时代下最典型的应用成果,未来几年,RTB广告必将引领网络广告革命,成为网络广告的主流。”曹彤表示。

RTB可以说是大数据在网络营销领域最成功的模式和变革,它利用第三方技术手段在数以百万计的网站上对每一个用户的行为进行评估、分析并出价购买。RTB的出现,改变了网络广告的策划逻辑,即从媒体购买向人群的实时购买转变,它所带来的基于大数据的实时精准,规避了无效的受众到达,让广告主、消费者和媒体的利益同时得到最大化。

而在柯细兴看来,RTB不仅仅是一种成功的模式,更是往后大数据在网络营销领域各种应用创新的基石。“RTB所带来的基于受众的精准,让网络广告营销往纵深发展,同时也是以后广告领域各种基于精准的应用创新的基础,因此,我们现阶段正在打牢RTB的基础,然后再基于RTB做出更贴近我们客户、媒体的应用创新。”

同时,RTB也给网络广告带来了结构性的变化,它带来了展示广告的新趋势和新变化,让展示广告进入了效果营销的时代,可以说RTB正在重塑整个展示广告的生态。

“此前,搜索广告在网络广告中一枝独秀,但现在RTB和大数据让有些式微的展示广告也能焕发第二春,让它有了与搜索广告比肩的可能,在我看来,这是大数据在网络营销领域带来的最大的变化。”柯细兴表示。

整合营销才是大势所趋

网络营销是对广告主、媒体和用户的不同角度的服务,而只有整合才能让广告主更准确地把握营销目标,让媒体更准确的把握流量价值,因此,整合可以说是网络营销未来必然的发展趋势之一。

“数据是整合的基础,在数据碎片化趋势下,整合的意义愈发彰显,大数据技术也是整合可以被持续推进的保障。”张伟表示。

整合又包括渠道整合和模式整合,其中渠道整合涉及跨媒介、跨平台、跨终端三个方面,而这“三跨”又离不开大数据的支持,其中所牵涉的数据的采集、识别、管理等整合行为都是基于大数据基础的。

此外,实时、精准、效果都是网络营销必然的发展趋势,而这三者又是依托于大数据的挖掘分析技术和商业智能技术,同时,在通过大数据把数据变得有价值、有意义之后,这三者又都是大数据功效的必然结果。

日前,“棱镜门”事件可谓触动了人们脑中关于隐私本就绷紧的神经,而网络营销要实现精准,不可避免就要搜集分析用户的相关信息,那么,是否对用户的隐私造成了侵犯呢?

“其实并非如此,棱镜门中涉及的都是互联网媒体型的公司,这些公司都是需要用户注册的,因此拥有的用户的PII数据,即个人用户信息,但网络营销不同,它所依赖的数据是基于cookie的,正好和个人用户信息相反,是一种匿名信息。”柯细兴解释道,“cookie是用户在上网时随机产生的一个数字标识,是一种有时效性的非个人信息,因此,我们认为它是非隐私性的。”

“精准营销是以用户在线行为数据为基础的,它不与真实身份相关联,只是在一个计算可识别的用户ID上设定各种具有营销价值的标签,通过这些标签是无法反推出它所代表的真实用户身份的,所以通常广告所涉及的精准营销相对安全。用户真正担心的隐私是掌握真实身份信息的服务提供商是否能对他们的信息保密。”张伟表示。

现在的大数据还处于初级阶段,距离真正的爆发期还有一长段的距离,但在未来几年,随着更多分析领域底层基础技术的发展,更多良好的易于使用的工具的开发,大数据营销必然会加速发展,涌现出更多更好的应用。

“大数据应用体系犹如一部庞大的机器,各部分都在飞速发展,但如何保证整体的有序和高效是每个应用者要不断平衡和取舍的。”张伟表示。

价值与隐私:双面大数据

从默默无闻到成为所有头版头条的标题,爱德华·斯诺登只用了几天时间。这个同时被称为“叛徒”和“英雄”的人,揭开了美国引以为傲的人权幕布,让互联网透过“棱镜”折射出“数据”与“隐私”的色彩。

在这场众说纷纭的罗生门中,抛开笼罩的政治色彩,爆发的大数据带给IT产业的究竟是无价的矿山还是隐私的黑洞,还是让我们换个角度重新看待一切——

数据矿山黄金还是黑金

早在19世纪,“百货商店之父”约翰·沃纳梅克便提出了:“我在广告上的投资有一半是无用的,但是问题是我不知道是哪一半?”这也是对经典商业模式下供需不对称的典型描述。直到1998年《哈佛商业评论》刊登的沃尔玛“尿布与啤酒”的案例,才算是较为完满地回答了这一问题:摆在尿布旁边的啤酒会因为潜藏的用户购物模式而提升各自的销量——这不仅是CRM数据挖掘的成功,也是大数据创造价值时代来临的信号。

随着互联网、移动互联、物联网等技术的不断发展,人们生活的方方面面都在被各式各样的数据不间断地记录下来:网页浏览记录、社交分享内容、购物刷卡记录、GPS定位信息……这些飞速增长的数据中所蕴含的价值,早已成为无数商家试图发掘的巨大金矿。

去年,西班牙电信推出了名为“智慧足迹”的大数据服务,通过向数据挖掘公司等合作方提供定向人流的移动数据,为零售客户开店选址和促销提供借鉴。而今年4月底,阿里巴巴以5.86亿美元入股新浪,声称“双方将在用户账户互通、数据交换、在线支付、网络营销等领域进行深入合作,并探索基于数亿的用户与阿里巴巴电子商务平台的数亿消费者有效互动的社会化电子商务模式。”

从以上的例子不难看出,借助大数据,商家可以有效地改善服务质量,为客户带来更为丰富的消费体验。但有的数据挖掘公司则选择了不同的着力方向——2004年,几位PayPal的老员工成立了一家名为Palantir Technologies的数据公司,公司主业是研发能够在多种类型的数据库中搜索信息和定位信息类型的软件,而该软件平台的名称正是“棱镜”(Prism)。这并不是巧合,Palantir正是美国情报机构成立的风投公司In-Q-TeL所资助的企业,其技术在日前被曝光的“棱镜门”中发挥了巨大的作用。

数字化背后的隐私危机

事实上,除了“棱镜门”曝光的内容,互联网用户早已或多或少受到了隐私被侵犯造成的困扰。例如,人们在购买汽车数年之后仍然持续收到各种保险和维修同类产品的广告推荐;消费者一些基于私人爱好的搜索会在大庭广众之下出现在令人难堪的大幅广告中等等。

如果这些还只算是令人困扰或者不悦的内容的话,那么随着数据搜索和挖掘技术的进一步发展,大数据势必将对人们的生活施加更为巨大的影响。复杂网络研究大师巴拉巴西在其著作《爆发:大数据时代预见未来的新思维》中提出,93%的人类行为能够通过有效的数据分析而进行预测。之后,统计学家Nate Silver通过海量数据分析对美国50个州选举结果的成功预测佐证了这一说法。

在互联网不断扩张的时代,用户隐私本身就在不断缩小。电商网站上的个人资料、即时沟通通讯软件的聊天记录、社交网络中的照片分享等等已经将用户完整地“数字化”,再加上搜索引擎抓取、专业数据统计与挖掘公司的分析,个人信息、联系方式、社交关系,以至于兴趣爱好、政治倾向等等都能够通过这些记录在案的数据得出结果。如果大数据的未来如同大片《少数派报告》中描述的一样,人类的信息、行为甚至思想都成为可以用来分析的数据,对于每一个人来说都将会是一幅刻板而可怕的图景。

在中国,由于数据挖掘方面的技术发展尚不充分,一些中小企业难以通过对手中的数据进行有效挖掘以获取价值,便通过直接出售用户数据来牟利,从而造成大量隐私泄露等状况的发生,更为大数据时代的到来蒙上了一层隐私危机的阴影。

趋利避害责任共担

大数据蕴含的丰富价值,是每一家企业都不愿意放弃的巨大蛋糕。而对于隐私敏感用户来说,大数据时代对隐私数据的保管显得尤为重要。价值与隐私,如同大数据这枚硬币的两面。用户该如何保护自己的隐私?手握用户数据的互联网企业又该如何在发掘大数据价值的同时,尽量不去碰触到那条敏感的隐私红线?

“棱镜门”爆发后,一家名不见经传的互联网搜索引擎DuckDuckGo瞬间爆红,搜索量增长达到30%以上。相比搜索巨头谷歌,这家搜索引擎以“从不追踪用户”且“从不过滤信息”为卖点,强化基于网页相关性的搜索结果。虽然在搜索结果针对性方面有所欠缺,却赢得了诸多隐私敏感用户的支持。目前,越来越多的个人隐私保护产品不断上线,从网站反追踪、浏览信息清理、加密传输等方面加强对用户数据的保障。事实上,除了选择更具安全性的产品之外,注重个人的隐私信息保管同样重要,如避免使用公共电脑、进入来源不明的网站、随意填写敏感信息等等。

而对于互联网企业,在开采大数据这一金矿的同时,也需要选择合适的方式和落脚点,包括投入挖掘和分析的数据范围、数据分析过程的保密、数据对外开放的程度等。对于掌握数据规模越大的企业,这一问题就显得愈发重要。

不仅如此,互联网企业对于用户数据的操作方式、使用范围和保障等信息也需要更加公开、透明。2011年,Facebook因为保留用户已删除的好友、信息和相关资料收到投诉;去年苹果也因为Siri能够保留用户语音数据长达两年而饱受指责……这些正是由于用户数据对于用户本身的不透明所致。在用户向企业提供自身信息的同时,同样希望这些信息能够处于可控范围内。对于用户数据的留存和使用既没有按照用户意愿执行,又没有提供相应说明,造成用户意料之外的隐私数据操作,其结果就是给用户带来隐私受到侵犯的不良感受。

在榜样另一方面,避免对用户形成“意料之外”的隐私侵犯的重要方法,就是培养用户价值观念。对于用户有价值的数据应用,能够有效减弱甚至抵消隐私数据的采集造成的影响。

例如中国最大的即时通讯软件——腾讯QQ,掌握着国内最为庞大的用户关系网,对于QQ侵犯用户隐私的质疑声一直没有间断。然而,QQ的好友生日提醒、空间/话题推送等基于用户关系的特色服务带来的用户忠诚度,始终保证了其国内第一即时通讯软件的大哥大头把交椅。

同样,微软也曾大肆批判谷歌Gmail通过过滤分析用户私人邮件内容进行广告投放的行为。事后,谷歌解释说称,数据采集、分析和广告投放是完全的机器行为,没有人为干预和隐私泄露。而谷歌更是凭借包括Gmail在内的众多相互关联的定制化服务,为用户提供了一整套移动、办公、娱乐环境,手机应用Google Now更能通过对用户行为的学习,为用户提供提醒、导航、推荐等智能化服务,受到业界的一致好评。

由此可见,大数据为用户带来的价值是毋庸置疑的,同时背后所包含的隐私风险也是切不可忽视的。对于商家而言,如何有效地控制用户数据应用范围、保障用户数据安全、利用大数据提供对用户有价值的服务,才是从大数据这个富矿座矿山中开掘真金的可靠途径。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号