当前位置:大数据业界动态 → 正文

大数据应用以“数据回报”为导向

责任编辑:editor004 |来源:企业网D1Net  2013-12-13 16:50:29 本文摘自:视听界

一、大数据的本质

首先,大数据显然不是能存放于电脑、手机、硬盘里的数据,它数据量巨大,已经不是以我们所熟知的G和T为单位来衡量,而是以P(1000个T),E(一百万个T)或Z(10亿个T)为计量单位,它需要更大的存储方式,比如云存储和其他大的存储层来安放。

其次,大数据显然不是一堆数据的堆集,而是数据与数据之间存在着某种关联,发现并利用这种关联可以产生价值;正如《大数据时代》一书的作者舍恩伯格所强调的,最重要的是人们可以很大程度上从对因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。只要发现两个数据之间存在相关性,就可能创造巨大的经济或社会效益,

第三,大数据是一种社会状态,其牵涉面很广,在物理、生物、金融、环境生态、军事,通讯、自动控制等各个领域都有相关应用。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或承载方式。随着互联网,特别是近年来移动互联网的繁荣,大数据在这个领域的作用越来越凸显,原因有三:其一,网络行为数据激增;其二,网络内容从单一的文字走向多媒体,使数据总量不断增长;其三,多屏多终端模式增加了用户对网络的使用次数与时长,大量数据因此增长且沉集。各行各业数据都呈现出一种指数倍爆发增长状态,大数据成为这个社会最为显著的标签。

第四,大数据是一种基于开放性的数据互通互联,以及在其基础之上的价值发现。信息孤岛、数据阻隔,都不利于大数据多用途的价值发现。

二、大数据应用的三个层面

大数据应用以“数据回报”为导向,通过对数据的收集、管理、分析、应用,最终获得经济收入、口碑回报与事业良性发展等价值效用。

1.数据收集

大数据运用的关键在于谁拥有数据。《纸牌屋》之所以能够通过大数据的精准制作而取得成功,前提是其投资方Netflix自身雄厚的数据资源。它拥有2700万名美国订阅用户、3300万名全球订阅用户,掌握这些用户的年龄、性别、居住地、使用服务终端、用户每天/每周的观看时间等数据。这使得它可以轻松利用大数据建模,对用户评分、观看记录、用户好友推荐等信息进行深度挖掘,甚至可以通过收集观众按下暂停或快进的数据,从而找出用户喜欢的视频风格、内容风格、导演和演员等等,这些关键数据是造就其成功的第一步。

对于传统媒体而言,获得数据的渠道可以是自己的网站、在其他平台上的APP、机顶盒等,博客、微博、微信中的内容,情绪符号、各类投票、链接、图像、视频、评论、文本文件、加关注、粉丝等信息及关系图谱中都隐藏着有价数据。只要在纵向上有一定的时间积累,在横向上有较丰富的记录细节,通过多个源头对同一个对象进行各类数据采集并且有机整合,就可能产生大价值。

2.数据管理

大数据的关键并不止于数据量的大小,而在于对数据的分析与应用能力。数据应用的前提是对数据进行高效管理。

数据分类 目前数据类型主要有:1.交易数据;2.行为数据(兴趣数据等);3.关系数据;4.位置数据;5.用户生产的内容UGC(包手信息、评论)等,将这些数据分门别类地收集,并在其中学会倾听用户需求,理解用户行为,从中发掘细分市场的机会,以此应对“技术+用户+品牌”的媒体新时代。

打通数据 随着新技术不断发展,多屏观看、跨屏互动已成为趋势,但现实却是各部门间组织结构的割裂情形,使得数据呈现离散与孤立状态。在数据分析时,对同一用户在不同终端的使用数据并没有串联起来整体分析,因此分析的结果必然与现实有很大的偏差。因此打通数据,让数据自由流动,发挥多重效能,是数据管理很重要的方面。以腾讯视频为例,他们利用云端收藏和云端播放,加上多平台可使用统一的ID号码,使得用户的收看行为成为一种不被打断的连续状态,用户无论采取手机、TV、Pad、PC登录,都可以通过云端收藏延续前面的收看行为。在方便用户的同时,这对于数据收集而言也是一个连续性的获得。此外,腾讯视频还给其媒资库的各类视频都打上“内容标签”及“用户行为标签”,并根据智能算法推荐最匹配的内容给最对的用户。

开放数据 大数据之所以能产生价值,在于数据的关联性,通过对关联数据的分析,挖掘其中蕴含的潜在价值。孤立的数据很难产生这样的效能,因此“开放数据”是数据管理的一种先进理念。任何一个机构都不可能自己进行所有的分析和运用,开放是利已也是利他。比如Facebook和Twitter就带头开放部分数据给第三方公司,他们的开放不是无偿的,希望从开放中受益。

3.数据应用

新媒体的本质就是数据分析,数据是客观的,但分析应用却是主观的,如何平衡二者的关系,是数据应用的一个关键。

大数据的应用延续着“信息—知识—智慧”三个层面:第一层面是“信息”,当一个个数据被赋予背景,它就成了“信息”;第二个层面是“知识”,当从一个个数据分析中提炼出规律,它就成了“知识”;第三个层面是“智慧”,当借助分析工具与当下的社会心理以及其他子系统背景,从数据中获得研判与预测的能力,这就是“智慧”。

在大数据时代,媒体和门户网站可充分利用大数据与关系链,为用户提供量身打造的新闻资讯,以及良好的体验。比如,优酷和土豆合并后,其搜索平台可挖掘并推算出4亿多视频用户的浏览行为;浙报集团去年投资数据分析项目,开辟社交网络数据深度挖掘的新战场;搜狐正着手将旗下数据资产全面打通整合,搭建基于云计算的大数据平台,以期获取每月9亿多人次的用户数据资产,一场关于数据的圈地运动正在展开。大数据有哪些具体应用呢?

为内容购买提供数据支持。以腾讯视频为例,他们通过数据分析来购买内容,依此购买的《隋唐演义》今年一季度独家播出播放量超过6个亿,独家剧《宝贝》播放量也超过3个亿。大数据为内容购买提供了精准的指向。

为用户提供信息图谱。新版腾讯微博利用大数据技术,将用户的微博进行整合、重组,将具有相同、相近信息的微博配以热门标签,用户通过进入标签,可看到这个热门事件发展脉络以及未来走向的一个清晰的“信息图谱”,减少用户获取信息的时间成本。

解决媒体与用户的关系问题。大数据是网络时代对网络用户行为的一个数据积累。这些数据一方面反映用户的兴趣偏好,从而有利于媒体制作出用户满意的产品;另一方面,数据对用户满意度也有非常重要的影响。大数据有助于媒体更好地了解用户,从而更好地处理媒体与用户之间的关系。以谷歌的“电影票房预测模型”为例,它通过数据建立了与用户的关联,通过对用户对电影相关内容搜索量的分析,能够提前一个月预测电影上映首周的票房收入,准确度高达94%。

三、大数据的媒体作为

媒体业是信息产业,在大数据时代拥有先天优势。麦肯锡全球研究所曾对美国17个行业拥有的数据量做了估算,离散式制造业居首位,拥有966PB数据总量;美国政府居第二位,拥有848PB的数据总量;传播与媒体业居第三位,共有715PB数据量。可见,媒体在大数据时代是有数据优势的。因此,媒体应有强烈的数据意识,善于收集数据、分析数据、使用数据。通过对海量和复杂的数字资料进行收集、整理,从而提升媒体的预测与研判能力。媒体能利用大数据做些什么?

1.洞察用户

面对互联网海量信息,基于抽样调查+人口学特征的“小样本模式”不再具有导航性,用户是“谁”已经不重要,重要的是“用户什么时候需要什么东西”,即用户的“兴趣偏好”及“传播时机”等信息更重要,而这一切来源于大数据及对它的挖掘。大数据构成中有不少数据来源于用户的网络行为、网络表达、网络情绪,这些数据之间有高度的相关性,通过对他们的分析就能清晰地描述出你的“用户”是什么样的,他们的“兴趣图谱”是什么,“行动路线”又是怎样的。挖掘用户的行为习惯和喜好,并在这些数据背后找到用户的“兴趣配方”,从而制造出相应的产品并提供相应的服务。

因为有大数据,Facebook、Twitter这类社交媒体远比报业、广电等传统媒体更了解他们的用户。因此,传统媒体可以通过与他们的合作,借助大数据更好地理解用户偏好及行为。也可以像英国第四台那样开发自己的注册系统,利用大数据研究他们的用户。这个注册系统目前有700万注册用户,其中三分之一为16—24岁的青年用户。与以往观众调查、听众来信不同,大数据拓展了媒体对于其用户了解的广度、深度及关联度。

2.协作式新闻

大数据使调查性报道有了更多可用的资源,一条调查性报道的出笼越来越凸显“协作式新闻报道”的流程及风格。报道中有来自用户贡献的UGC内容,有专业记者采写的报道,有数据分析师从大数据系统发现的线索、关系图谱、发展趋势等,有责任编辑负责新闻报道最后的呈现,有专门的新媒体运营者来实施这条报道在各个平台的推送,以掀起社会影响力。因为大数据,新闻生产流程将会发生大的变化。新闻不再是单兵作战,协作式新闻将成为主流生产模式。

3.广告精准投放

大数据的多维度与实时性为广告精准投放提供了可能。例如,《经济学家》建立了自己的数据库,包括用户的注册信息、国家、投递地址、邮件地址、打开邮箱频率等,为实现移动端的广告订制与目标推送建立了可能。广告的精准投放将会改变广告业整体的媒介购买偏好及广告投放配比,越来越多的广告将被投放到社交媒体,这对广电等依靠广告而生的传统媒体而言将产生深远影响。

4.舆论分析与研判

现阶段,新闻媒体可以用大数据做什么?1.讲故事;2.来分析各种评论;3.降低信息过载(即大数据可以提供相关背景资料,让人们获得的不仅是一条条信息,而是围绕这条信息形成的一个“知识图谱”,这有利于降低用户获取知识的成本);4.进行舆论分析。以“阿拉伯之春”为例,通过大数据的深度挖掘,可以了解多少人和哪些人正在从温和立场变得更为激进,并“算出”谁可能会采取对某些人有害的行动。这正是大数据的舆论分析及事态预判能力。然而,舆论引导在大数据时代却变得更困难,因为信息越来越透明化且结构化,且这种结构化是非人工的,由算法得来的,虽然在设置变量等因素时可能有能动性与操控空间,但整体而言,这种非人工的结构化信息,部分消解了先前人工化组织的“议程设置”等引导舆论的方式。

四、大数据重塑媒介生态

目前全球互联网用户已经达到25亿,手机用户超过64亿,基于网络信息技术的新媒体已经成为当今世界最活跃和最重要的发展领域。大量的数据将被创造出来:据IDC估计,到2020年的时候,数据量将由2012年的2.7ZB猛增到35ZB。我国已拥有5.78亿互联网用户和11亿多手机用户,以大数据、云计算为代表的新兴业态将不断呈现,无疑,这些都将重塑媒介生态。

1.理念

首先,树立用户理念,认识到大数据是帮助媒体建立起与用户关联的重要支撑,通过大数据,媒体会更加理解用户及其需求,这从根本上转变了媒体“传者本位”的旧面貌。其次,认识到大数据是媒体的“新石油”,但是它的价值不止于数据本身,而在于数据带来的意义。目前,80%不断增长的大数据,包括文字、3D照片、邮件信息等内容都还处在未被组织化与结构化的状态中,是无意义的。如何将这些数据组织化与结构化是一个重大命题。第三,先前媒体是“分发(传播)驱动”,现在媒体变为“数据驱动”,在“数据驱动”这一媒体新动力中,解决人们信息冗余、知识缺乏也是一个重要方面。

此外,“开放”是媒体迎接大数据时代的最佳选择。孤立的数据缺少价值,而任何组织都不可能处理所有的数据,因此,借用第三方数据、引入第三方力量、向第三方开放数据,都可避免自己变成“信息孤岛”,增加多触点及外部通路是大数据时代媒体的生存之道。

2.平台

大数据时代,平台为王。对传统媒体来说,数据量的快速增长,需要在带宽和存储设备等基础设施方面加大投入,对当前的报道形式和运行体系进行全面改造,建立媒体机构自己的基于大数据技术的智能平台,但这需要决策者相当的胆识与相应的资本支持。对于大多数传统媒体而言,大数据时代,受众数据缺乏是困中之困。读者数据的缺乏催生了一些传统媒体的平台变革。创办于1887年,旗下拥有15家日报、36家周报、29家电视台以及数百种杂志的美国赫斯特传媒集团,在去年11月收购Spooky Cool Labs的社交游戏公司,将游戏作为其内容产业延伸及读者数据获得的全新平台。浙江日报报业集团于去年底斥资32亿收购了网络用户集聚平台——边锋浩方网络平台,这个平台上有五六百款的游戏,活跃用户达2000多万,最高在线人数150万。浙报集团通过这个平台,建立数据分析系统,深入筛选捕捉用户行为、习惯、偏好和需求,挖掘数据资源,以弥补传统媒体读者数据不足的缺陷。

3.人才

大数据时代,除了平台等硬件要跟上之外,数据挖掘与深度分析的专业人员更不可缺。据麦肯锡全球研究所报告指出,美国需要150万精通数据的经理人员,以及14万到19万深度数据分析方面的专家。

数据加工能力匮乏、缺乏专门的数据分析方法及高端专业人才,是很多媒体应对大数据时代的重要挑战。研究机构预测:未来七成以上传统采编将转岗,媒体将实现整体结构转换,数字分析人员将占到总比例的五分之一。如果媒体人才跟不上,即使数据平台搭建好了,对于数据的开发与发析也会因人才不足而难以发生效用。因此,传统媒体在大数据时代一方面要搭建数据平台,另一方面也培养数据分析人才。美国《赫芬顿邮报》的在线媒体团队中,除了传统的记者、编辑以外,还设置了用户体验设计师、流量编辑、产品经理等互联网公司的常规职位。

4.广告

大数据改变了媒体投放比。以前广告主在广告投放时经常会遇到“我们应该在哪个媒体投放”、“需要投放多少广告”、“应当如何分配广告费”、“用户看到广告有无共鸣、有无行动”等问题,这些在大数据时代都可以通过数据分析看到结果。大数据使得广告的精准投放成为可能,社交媒体因大数据而受到广告主的青睐。先前对在线媒体的评估方法主要是搜索、广告位的转化率等,这些方式都只能得到客户的行为结果,而对于品牌建立的有效性、长久性仍然缺乏真实体认。但大数据改变了这一切,伴随着语义分析软件、语言处理软件、机器认知软件、集群分析软件等,大数据可以揭示出在线市场行为的真实结果。大数据让社交媒体的价值被重新定位,广告主因此也会重新评估自己在社交媒体及传统媒体上的投入配比,这对依靠广告而生的传统广电而言无疑是大挑战。

大数据改变了广告形态。用户获取广告的通路越来越多,但用户分配给每个广告上的时间却越来越少,在这一情形下,让自己的广告长得不像广告,将广告融于信息与内容中,将会增大广告被关注的可能性,腾讯目前做的基于信息流的广告就是这种新形态。此外,还有一些基于位置信息的广告也应运而生,比如,大数据可以通过用户手机的品牌、手机所在位置、移动路线、手机中安装的APP类型来判断用户的基本特征,并依据算法分析出用户的兴趣偏好,从而适时、适位地向用户推送相应广告,这种推送甚至可以依据地域定向、性别定向、场景定向来投放,这样了解用户需求的广告,投放效果必然优于先前的非精准的广告投放。

5.新闻生产与呈现

美国哥伦比亚新闻学院Tow数字新闻中心去年12月发布的研究报告指出:新技术带来新闻生产流程的变化,截稿期与新闻形态不再严格限定,地理因素对于新闻信息收集、生产、消费而言不再重要,社会活动与数据的信息流提供了新的未经过滤的素材。而新闻生产也越来越呈现出“内容动态化”与“内容在线管理”的新特质。

大数据怎样改变了新闻的生产与呈现呢?

首先,记者可以通过计算机辅助采访丰富自己的报道。在大数据时代,除了政府、机构、企业等公开发布的数据外,媒体、网站拥有的用户数据、用户生产的内容,也是新闻从业人员重要的数据资源。那些公开或者隐蔽的数据,都为记者发现新闻选题、拓展新闻深度提供了重要线索。

其次,“算法新闻与机器写作”将成为新闻新形态。美国IT杂志《连线》记者史蒂芬列维发表文章,称未来计算机可代替人生产90%左右的新闻。文章引用了一家名为Narrative的公司的例子。这是一家拥有大约30名员工的美国公司,它们运用Narrative Science算法,大约每30秒就能够撰写出一篇新闻报道。这种计算机撰写的新闻稿可以是关于美国篮球比赛的消息。

第三,在新闻生产的采访、编辑、播出的全过程中都可以不断调整甚至重置以符合用户的新需求。这与过去封闭式、一次成型的内容生产方式全然不同,它更强调吸引用户关注、参与并且分享新闻生产。

此外,大数据时代也改变了新闻呈现。信息图表在新闻呈现中扮演着越来越重要的作用。根据道格?纽瑟姆(Doug Newsom)的概括,作为视觉化工具的信息图表包括:图表(chart)、图解(diagram)、图形(graph)、表格(table)、地图(map)和列表(list)等。信息图表不仅是对文字报道的扩充与延伸,也被当作独立的新闻形式,它为用户提供了一个“信息图谱”,将新闻事件的关联、背景、数据、分析、评论以图谱形式呈现,有助于用户视觉化地了解信息全貌。

6.机构

大数据时代的数据分析基本单位是个人用户,收集的是单一个体全面、完整,动态,实时的网络行为,并在此基础上归纳出的“群体行为”与“社会心理”。负责大数据的“数据管理与分析”部门,应该位于媒体的核心地位,整体把握媒介产品开发、媒体运营以及媒体商业模式,这就要求对现有的组织架构进行重组, “一个媒体一个团队”的传统架构将被“内容采集部门、平台维护部门、广电内容制作部门、新媒体制作部门”四大分类取代。具体而言,“内容采集部门”负责所有内容的收集及提供,包括新闻记者采写的内容、UGC内容、背景资料、各类评论及图表等;“平台维护部门”主要负责大数据平台的维护,包括call center这样的用户反馈数据收集、数据库、媒资库、广电云以及来自第三方平台的有用数据的获取、管理与应用等;“广电内容制作部门”主要是从“内容采集部门”与“平台维护部门”获取自己所需的线索、数据、新闻内容,制作成相应的广播产品或电视产品,并在相应平台推送;“新媒体制作部门”则主要将其他部门提供的内容制作成适合网络平台、移动平台、数字平台等新媒体各平台传播的相应产品,并且利用微博、微信等多平台、多屏幕进行推广。

与“云计算”、“物联网”前些年被热炒的情形一样,大数据也成了人们口边的热词,值得警醒的是,大数据并不是收集的数据越多就越好,而是用一种高性价比的方式看到以前不曾看到的事物的颗粒度与细节,并能够用更加快速、准确的方式来处理数据、做出研判与预测,这一点对于每一个企图在大数据时代建功立业却囿于数据缺乏的媒体而言,至关重要。

关键字:人口学特征Netflix存储层大数据

本文摘自:视听界

x 大数据应用以“数据回报”为导向 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据应用以“数据回报”为导向

责任编辑:editor004 |来源:企业网D1Net  2013-12-13 16:50:29 本文摘自:视听界

一、大数据的本质

首先,大数据显然不是能存放于电脑、手机、硬盘里的数据,它数据量巨大,已经不是以我们所熟知的G和T为单位来衡量,而是以P(1000个T),E(一百万个T)或Z(10亿个T)为计量单位,它需要更大的存储方式,比如云存储和其他大的存储层来安放。

其次,大数据显然不是一堆数据的堆集,而是数据与数据之间存在着某种关联,发现并利用这种关联可以产生价值;正如《大数据时代》一书的作者舍恩伯格所强调的,最重要的是人们可以很大程度上从对因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。只要发现两个数据之间存在相关性,就可能创造巨大的经济或社会效益,

第三,大数据是一种社会状态,其牵涉面很广,在物理、生物、金融、环境生态、军事,通讯、自动控制等各个领域都有相关应用。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或承载方式。随着互联网,特别是近年来移动互联网的繁荣,大数据在这个领域的作用越来越凸显,原因有三:其一,网络行为数据激增;其二,网络内容从单一的文字走向多媒体,使数据总量不断增长;其三,多屏多终端模式增加了用户对网络的使用次数与时长,大量数据因此增长且沉集。各行各业数据都呈现出一种指数倍爆发增长状态,大数据成为这个社会最为显著的标签。

第四,大数据是一种基于开放性的数据互通互联,以及在其基础之上的价值发现。信息孤岛、数据阻隔,都不利于大数据多用途的价值发现。

二、大数据应用的三个层面

大数据应用以“数据回报”为导向,通过对数据的收集、管理、分析、应用,最终获得经济收入、口碑回报与事业良性发展等价值效用。

1.数据收集

大数据运用的关键在于谁拥有数据。《纸牌屋》之所以能够通过大数据的精准制作而取得成功,前提是其投资方Netflix自身雄厚的数据资源。它拥有2700万名美国订阅用户、3300万名全球订阅用户,掌握这些用户的年龄、性别、居住地、使用服务终端、用户每天/每周的观看时间等数据。这使得它可以轻松利用大数据建模,对用户评分、观看记录、用户好友推荐等信息进行深度挖掘,甚至可以通过收集观众按下暂停或快进的数据,从而找出用户喜欢的视频风格、内容风格、导演和演员等等,这些关键数据是造就其成功的第一步。

对于传统媒体而言,获得数据的渠道可以是自己的网站、在其他平台上的APP、机顶盒等,博客、微博、微信中的内容,情绪符号、各类投票、链接、图像、视频、评论、文本文件、加关注、粉丝等信息及关系图谱中都隐藏着有价数据。只要在纵向上有一定的时间积累,在横向上有较丰富的记录细节,通过多个源头对同一个对象进行各类数据采集并且有机整合,就可能产生大价值。

2.数据管理

大数据的关键并不止于数据量的大小,而在于对数据的分析与应用能力。数据应用的前提是对数据进行高效管理。

数据分类 目前数据类型主要有:1.交易数据;2.行为数据(兴趣数据等);3.关系数据;4.位置数据;5.用户生产的内容UGC(包手信息、评论)等,将这些数据分门别类地收集,并在其中学会倾听用户需求,理解用户行为,从中发掘细分市场的机会,以此应对“技术+用户+品牌”的媒体新时代。

打通数据 随着新技术不断发展,多屏观看、跨屏互动已成为趋势,但现实却是各部门间组织结构的割裂情形,使得数据呈现离散与孤立状态。在数据分析时,对同一用户在不同终端的使用数据并没有串联起来整体分析,因此分析的结果必然与现实有很大的偏差。因此打通数据,让数据自由流动,发挥多重效能,是数据管理很重要的方面。以腾讯视频为例,他们利用云端收藏和云端播放,加上多平台可使用统一的ID号码,使得用户的收看行为成为一种不被打断的连续状态,用户无论采取手机、TV、Pad、PC登录,都可以通过云端收藏延续前面的收看行为。在方便用户的同时,这对于数据收集而言也是一个连续性的获得。此外,腾讯视频还给其媒资库的各类视频都打上“内容标签”及“用户行为标签”,并根据智能算法推荐最匹配的内容给最对的用户。

开放数据 大数据之所以能产生价值,在于数据的关联性,通过对关联数据的分析,挖掘其中蕴含的潜在价值。孤立的数据很难产生这样的效能,因此“开放数据”是数据管理的一种先进理念。任何一个机构都不可能自己进行所有的分析和运用,开放是利已也是利他。比如Facebook和Twitter就带头开放部分数据给第三方公司,他们的开放不是无偿的,希望从开放中受益。

3.数据应用

新媒体的本质就是数据分析,数据是客观的,但分析应用却是主观的,如何平衡二者的关系,是数据应用的一个关键。

大数据的应用延续着“信息—知识—智慧”三个层面:第一层面是“信息”,当一个个数据被赋予背景,它就成了“信息”;第二个层面是“知识”,当从一个个数据分析中提炼出规律,它就成了“知识”;第三个层面是“智慧”,当借助分析工具与当下的社会心理以及其他子系统背景,从数据中获得研判与预测的能力,这就是“智慧”。

在大数据时代,媒体和门户网站可充分利用大数据与关系链,为用户提供量身打造的新闻资讯,以及良好的体验。比如,优酷和土豆合并后,其搜索平台可挖掘并推算出4亿多视频用户的浏览行为;浙报集团去年投资数据分析项目,开辟社交网络数据深度挖掘的新战场;搜狐正着手将旗下数据资产全面打通整合,搭建基于云计算的大数据平台,以期获取每月9亿多人次的用户数据资产,一场关于数据的圈地运动正在展开。大数据有哪些具体应用呢?

为内容购买提供数据支持。以腾讯视频为例,他们通过数据分析来购买内容,依此购买的《隋唐演义》今年一季度独家播出播放量超过6个亿,独家剧《宝贝》播放量也超过3个亿。大数据为内容购买提供了精准的指向。

为用户提供信息图谱。新版腾讯微博利用大数据技术,将用户的微博进行整合、重组,将具有相同、相近信息的微博配以热门标签,用户通过进入标签,可看到这个热门事件发展脉络以及未来走向的一个清晰的“信息图谱”,减少用户获取信息的时间成本。

解决媒体与用户的关系问题。大数据是网络时代对网络用户行为的一个数据积累。这些数据一方面反映用户的兴趣偏好,从而有利于媒体制作出用户满意的产品;另一方面,数据对用户满意度也有非常重要的影响。大数据有助于媒体更好地了解用户,从而更好地处理媒体与用户之间的关系。以谷歌的“电影票房预测模型”为例,它通过数据建立了与用户的关联,通过对用户对电影相关内容搜索量的分析,能够提前一个月预测电影上映首周的票房收入,准确度高达94%。

三、大数据的媒体作为

媒体业是信息产业,在大数据时代拥有先天优势。麦肯锡全球研究所曾对美国17个行业拥有的数据量做了估算,离散式制造业居首位,拥有966PB数据总量;美国政府居第二位,拥有848PB的数据总量;传播与媒体业居第三位,共有715PB数据量。可见,媒体在大数据时代是有数据优势的。因此,媒体应有强烈的数据意识,善于收集数据、分析数据、使用数据。通过对海量和复杂的数字资料进行收集、整理,从而提升媒体的预测与研判能力。媒体能利用大数据做些什么?

1.洞察用户

面对互联网海量信息,基于抽样调查+人口学特征的“小样本模式”不再具有导航性,用户是“谁”已经不重要,重要的是“用户什么时候需要什么东西”,即用户的“兴趣偏好”及“传播时机”等信息更重要,而这一切来源于大数据及对它的挖掘。大数据构成中有不少数据来源于用户的网络行为、网络表达、网络情绪,这些数据之间有高度的相关性,通过对他们的分析就能清晰地描述出你的“用户”是什么样的,他们的“兴趣图谱”是什么,“行动路线”又是怎样的。挖掘用户的行为习惯和喜好,并在这些数据背后找到用户的“兴趣配方”,从而制造出相应的产品并提供相应的服务。

因为有大数据,Facebook、Twitter这类社交媒体远比报业、广电等传统媒体更了解他们的用户。因此,传统媒体可以通过与他们的合作,借助大数据更好地理解用户偏好及行为。也可以像英国第四台那样开发自己的注册系统,利用大数据研究他们的用户。这个注册系统目前有700万注册用户,其中三分之一为16—24岁的青年用户。与以往观众调查、听众来信不同,大数据拓展了媒体对于其用户了解的广度、深度及关联度。

2.协作式新闻

大数据使调查性报道有了更多可用的资源,一条调查性报道的出笼越来越凸显“协作式新闻报道”的流程及风格。报道中有来自用户贡献的UGC内容,有专业记者采写的报道,有数据分析师从大数据系统发现的线索、关系图谱、发展趋势等,有责任编辑负责新闻报道最后的呈现,有专门的新媒体运营者来实施这条报道在各个平台的推送,以掀起社会影响力。因为大数据,新闻生产流程将会发生大的变化。新闻不再是单兵作战,协作式新闻将成为主流生产模式。

3.广告精准投放

大数据的多维度与实时性为广告精准投放提供了可能。例如,《经济学家》建立了自己的数据库,包括用户的注册信息、国家、投递地址、邮件地址、打开邮箱频率等,为实现移动端的广告订制与目标推送建立了可能。广告的精准投放将会改变广告业整体的媒介购买偏好及广告投放配比,越来越多的广告将被投放到社交媒体,这对广电等依靠广告而生的传统媒体而言将产生深远影响。

4.舆论分析与研判

现阶段,新闻媒体可以用大数据做什么?1.讲故事;2.来分析各种评论;3.降低信息过载(即大数据可以提供相关背景资料,让人们获得的不仅是一条条信息,而是围绕这条信息形成的一个“知识图谱”,这有利于降低用户获取知识的成本);4.进行舆论分析。以“阿拉伯之春”为例,通过大数据的深度挖掘,可以了解多少人和哪些人正在从温和立场变得更为激进,并“算出”谁可能会采取对某些人有害的行动。这正是大数据的舆论分析及事态预判能力。然而,舆论引导在大数据时代却变得更困难,因为信息越来越透明化且结构化,且这种结构化是非人工的,由算法得来的,虽然在设置变量等因素时可能有能动性与操控空间,但整体而言,这种非人工的结构化信息,部分消解了先前人工化组织的“议程设置”等引导舆论的方式。

四、大数据重塑媒介生态

目前全球互联网用户已经达到25亿,手机用户超过64亿,基于网络信息技术的新媒体已经成为当今世界最活跃和最重要的发展领域。大量的数据将被创造出来:据IDC估计,到2020年的时候,数据量将由2012年的2.7ZB猛增到35ZB。我国已拥有5.78亿互联网用户和11亿多手机用户,以大数据、云计算为代表的新兴业态将不断呈现,无疑,这些都将重塑媒介生态。

1.理念

首先,树立用户理念,认识到大数据是帮助媒体建立起与用户关联的重要支撑,通过大数据,媒体会更加理解用户及其需求,这从根本上转变了媒体“传者本位”的旧面貌。其次,认识到大数据是媒体的“新石油”,但是它的价值不止于数据本身,而在于数据带来的意义。目前,80%不断增长的大数据,包括文字、3D照片、邮件信息等内容都还处在未被组织化与结构化的状态中,是无意义的。如何将这些数据组织化与结构化是一个重大命题。第三,先前媒体是“分发(传播)驱动”,现在媒体变为“数据驱动”,在“数据驱动”这一媒体新动力中,解决人们信息冗余、知识缺乏也是一个重要方面。

此外,“开放”是媒体迎接大数据时代的最佳选择。孤立的数据缺少价值,而任何组织都不可能处理所有的数据,因此,借用第三方数据、引入第三方力量、向第三方开放数据,都可避免自己变成“信息孤岛”,增加多触点及外部通路是大数据时代媒体的生存之道。

2.平台

大数据时代,平台为王。对传统媒体来说,数据量的快速增长,需要在带宽和存储设备等基础设施方面加大投入,对当前的报道形式和运行体系进行全面改造,建立媒体机构自己的基于大数据技术的智能平台,但这需要决策者相当的胆识与相应的资本支持。对于大多数传统媒体而言,大数据时代,受众数据缺乏是困中之困。读者数据的缺乏催生了一些传统媒体的平台变革。创办于1887年,旗下拥有15家日报、36家周报、29家电视台以及数百种杂志的美国赫斯特传媒集团,在去年11月收购Spooky Cool Labs的社交游戏公司,将游戏作为其内容产业延伸及读者数据获得的全新平台。浙江日报报业集团于去年底斥资32亿收购了网络用户集聚平台——边锋浩方网络平台,这个平台上有五六百款的游戏,活跃用户达2000多万,最高在线人数150万。浙报集团通过这个平台,建立数据分析系统,深入筛选捕捉用户行为、习惯、偏好和需求,挖掘数据资源,以弥补传统媒体读者数据不足的缺陷。

3.人才

大数据时代,除了平台等硬件要跟上之外,数据挖掘与深度分析的专业人员更不可缺。据麦肯锡全球研究所报告指出,美国需要150万精通数据的经理人员,以及14万到19万深度数据分析方面的专家。

数据加工能力匮乏、缺乏专门的数据分析方法及高端专业人才,是很多媒体应对大数据时代的重要挑战。研究机构预测:未来七成以上传统采编将转岗,媒体将实现整体结构转换,数字分析人员将占到总比例的五分之一。如果媒体人才跟不上,即使数据平台搭建好了,对于数据的开发与发析也会因人才不足而难以发生效用。因此,传统媒体在大数据时代一方面要搭建数据平台,另一方面也培养数据分析人才。美国《赫芬顿邮报》的在线媒体团队中,除了传统的记者、编辑以外,还设置了用户体验设计师、流量编辑、产品经理等互联网公司的常规职位。

4.广告

大数据改变了媒体投放比。以前广告主在广告投放时经常会遇到“我们应该在哪个媒体投放”、“需要投放多少广告”、“应当如何分配广告费”、“用户看到广告有无共鸣、有无行动”等问题,这些在大数据时代都可以通过数据分析看到结果。大数据使得广告的精准投放成为可能,社交媒体因大数据而受到广告主的青睐。先前对在线媒体的评估方法主要是搜索、广告位的转化率等,这些方式都只能得到客户的行为结果,而对于品牌建立的有效性、长久性仍然缺乏真实体认。但大数据改变了这一切,伴随着语义分析软件、语言处理软件、机器认知软件、集群分析软件等,大数据可以揭示出在线市场行为的真实结果。大数据让社交媒体的价值被重新定位,广告主因此也会重新评估自己在社交媒体及传统媒体上的投入配比,这对依靠广告而生的传统广电而言无疑是大挑战。

大数据改变了广告形态。用户获取广告的通路越来越多,但用户分配给每个广告上的时间却越来越少,在这一情形下,让自己的广告长得不像广告,将广告融于信息与内容中,将会增大广告被关注的可能性,腾讯目前做的基于信息流的广告就是这种新形态。此外,还有一些基于位置信息的广告也应运而生,比如,大数据可以通过用户手机的品牌、手机所在位置、移动路线、手机中安装的APP类型来判断用户的基本特征,并依据算法分析出用户的兴趣偏好,从而适时、适位地向用户推送相应广告,这种推送甚至可以依据地域定向、性别定向、场景定向来投放,这样了解用户需求的广告,投放效果必然优于先前的非精准的广告投放。

5.新闻生产与呈现

美国哥伦比亚新闻学院Tow数字新闻中心去年12月发布的研究报告指出:新技术带来新闻生产流程的变化,截稿期与新闻形态不再严格限定,地理因素对于新闻信息收集、生产、消费而言不再重要,社会活动与数据的信息流提供了新的未经过滤的素材。而新闻生产也越来越呈现出“内容动态化”与“内容在线管理”的新特质。

大数据怎样改变了新闻的生产与呈现呢?

首先,记者可以通过计算机辅助采访丰富自己的报道。在大数据时代,除了政府、机构、企业等公开发布的数据外,媒体、网站拥有的用户数据、用户生产的内容,也是新闻从业人员重要的数据资源。那些公开或者隐蔽的数据,都为记者发现新闻选题、拓展新闻深度提供了重要线索。

其次,“算法新闻与机器写作”将成为新闻新形态。美国IT杂志《连线》记者史蒂芬列维发表文章,称未来计算机可代替人生产90%左右的新闻。文章引用了一家名为Narrative的公司的例子。这是一家拥有大约30名员工的美国公司,它们运用Narrative Science算法,大约每30秒就能够撰写出一篇新闻报道。这种计算机撰写的新闻稿可以是关于美国篮球比赛的消息。

第三,在新闻生产的采访、编辑、播出的全过程中都可以不断调整甚至重置以符合用户的新需求。这与过去封闭式、一次成型的内容生产方式全然不同,它更强调吸引用户关注、参与并且分享新闻生产。

此外,大数据时代也改变了新闻呈现。信息图表在新闻呈现中扮演着越来越重要的作用。根据道格?纽瑟姆(Doug Newsom)的概括,作为视觉化工具的信息图表包括:图表(chart)、图解(diagram)、图形(graph)、表格(table)、地图(map)和列表(list)等。信息图表不仅是对文字报道的扩充与延伸,也被当作独立的新闻形式,它为用户提供了一个“信息图谱”,将新闻事件的关联、背景、数据、分析、评论以图谱形式呈现,有助于用户视觉化地了解信息全貌。

6.机构

大数据时代的数据分析基本单位是个人用户,收集的是单一个体全面、完整,动态,实时的网络行为,并在此基础上归纳出的“群体行为”与“社会心理”。负责大数据的“数据管理与分析”部门,应该位于媒体的核心地位,整体把握媒介产品开发、媒体运营以及媒体商业模式,这就要求对现有的组织架构进行重组, “一个媒体一个团队”的传统架构将被“内容采集部门、平台维护部门、广电内容制作部门、新媒体制作部门”四大分类取代。具体而言,“内容采集部门”负责所有内容的收集及提供,包括新闻记者采写的内容、UGC内容、背景资料、各类评论及图表等;“平台维护部门”主要负责大数据平台的维护,包括call center这样的用户反馈数据收集、数据库、媒资库、广电云以及来自第三方平台的有用数据的获取、管理与应用等;“广电内容制作部门”主要是从“内容采集部门”与“平台维护部门”获取自己所需的线索、数据、新闻内容,制作成相应的广播产品或电视产品,并在相应平台推送;“新媒体制作部门”则主要将其他部门提供的内容制作成适合网络平台、移动平台、数字平台等新媒体各平台传播的相应产品,并且利用微博、微信等多平台、多屏幕进行推广。

与“云计算”、“物联网”前些年被热炒的情形一样,大数据也成了人们口边的热词,值得警醒的是,大数据并不是收集的数据越多就越好,而是用一种高性价比的方式看到以前不曾看到的事物的颗粒度与细节,并能够用更加快速、准确的方式来处理数据、做出研判与预测,这一点对于每一个企图在大数据时代建功立业却囿于数据缺乏的媒体而言,至关重要。

关键字:人口学特征Netflix存储层大数据

本文摘自:视听界

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^