当前位置:大数据业界动态 → 正文

大数据在应急管理中的应用

责任编辑:editor005 作者:马奔 毛庆铎 |来源:企业网D1Net  2015-03-11 13:35:18 本文摘自:人民网

当前大数据正在改变世界,而数据收集和分析则是提升应急管理功能的重要手段。在对大数据内涵和具体案例进行分析后就会发现,大数据在应急管理中的应用主要有大数据技术和大数据思维两种方式。在应急管理的事前准备、事中响应和事后救援与恢复的每一阶段都可以引入大数据的应用,每个阶段对大数据的应用程度也会因其需要应对内容的不同而有所差别。大数据的应用有助于提高应急管理效率、节省成本和减少损失。我国需要在大数据战略、大数据开放政策、大数据在应急管理中具体应用形式等方面做出部署与探索。

欧美一些国家已经开始把大数据运用到应急管理中,并取得一定成效,当前国内实务界和学术界虽然开始关注大数据的应用,但相关研究还比较缺乏。本文根据大数据的内涵,归纳了大数据在应急管理中的应用方式和基本框架,总结了大数据在应急管理中的实践案例,期望对我国大数据在应急管理中的应用和研究有所启示。

一、大数据的内涵和在应急管理中应用的基本框架

关于大数据的内涵并没有完全一致的理解,如按照麦肯锡全球研究所(McKinsey Global Institute)的定义,大数据指的是超出常规数据库软件工具所能捕获、存储、管理和分析的超大规模数据集。[1]也有的从数据集的特点入手,界定了大数据的三个主要特点,即常用的3V界定:规模性(Volume)、多样性(Variety)和高速性(Velocity)。[2]舍恩伯格在《大数据时代》中反复强调:大数据是人们获得新认知、创造新价值的源泉;大数据还是改变市场、组织机构以及政府与公民关系的方法[3],强调以大数据技术为基础的新思维和新方法。

由于对“大数据”的认识存在差别,综合不同的定义看,“大数据”在不同领域内包含三层含义,可以分别从现实和技术两方面加以阐释:第一层意义上的“大数据”指的是数据的巨量化和多样化,现实方面指的是海量数据,技术方面指的是海量数据存储;第二层意义上的“大数据”指的是大数据技术,现实方面指的是对已有或者新获取的大量数据进行分析和利用,技术方面是指云存储和云计算;第三层意义上的“大数据”指的是大数据思维或者大数据方法,现实方面指的是把目标全体作为样本的研究方式、模糊化的思维方式、侧重相关性的思考方式等理念,技术方面是指利用海量数据进行分析、处理并用以辅助决策,或者直接进行机器决策、半机器决策的全过程大数据方法,这种对大数据的认知方式涉及到“大数据项目”或“大数据技术应用”的认知,并由此可以延伸出大数据视角下的应急管理方式。

大数据在应急管理中的应用方式分为两部分:大数据技术和大数据思维。大数据技术既包括诸如数据仓库、数据集市和数据可视化等旧技术,也包括云存储和云计算等新技术;而大数据思维则是从海量数据中发现问题,用全样本的思维来思考问题,形成了模糊化、相关性和整体化的考虑方式。[4]大数据技术与思维相互融合和作用,共同形成了大数据的应用,并对包括应急管理在内的很多公共管理领域产生了巨大影响。如英国皇家联合军种国防研究所2013年的报告提出,大数据的应用包含四个特征:快速的收集、分析、决策和反应机制;在分析和结论方面有极高的可信度;无论是在个人还是群体的行为预测方面都应该更有预见性和更高的准确度;重视数据和充分利用,最好是能够多次使用数据。[5]

按照突发事件发生的时间顺序,整个应急管理大致可以分为事前、事中和事后三个阶段,包括预防准备、监测预警、应急处置、善后恢复等多个环节。由于当前大数据在应急管理中大多处于技术应用阶段,并没有针对应急管理中大数据的应用进行严格分类,因此本文根据应急管理最简单的时间序列划分法,探讨了大数据在应急管理中事前、事中和事后应用的基本框架(见图1)。

当然,由于应急管理针对的事件类型不同,并非所有的应急管理领域都会涉及到大数据在三个过程中的应用。有时候可能并不需要进行数据的重新收集和硬件系统的整合,而只需要进行管理模式和思维的变化,就可以形成新的大数据应用方式,这也是大数据在应急管理甚至是公共管理应用中不同于纯技术导向应用的核心所在。

资料来源:作者整理

二、大数据在应急管理中应用的具体分析和实践

由于应急管理三个阶段的任务不同,且不同性质的突发事件也有发生机理和破坏方式的差异,针对不同突发事件进行应急管理时,所侧重的应对阶段也有所不同。如地震、海啸等发生突然,现场反应时间很短,进行“事中响应”非常困难,需要着重预防和救援;而森林火灾等预防困难,救援难度大,现场应对更为重要。因此,就需要根据突发事件的不同特点,在不同阶段应用大数据,可以起到事半功倍的效果。

(一)事前准备

在事前准备阶段,需要为大数据的应用进行相应的管理和设施准备。管理准备指的是与大数据管理、大数据方法相匹配的人事准备和管理提升。设施准备指的是大数据应用所需要的硬件和软件设施。硬件设施主要涉及新技术背景下的数据采集,而软件设施不但涉及到新数据的采集,也可以针对旧有数据进行分析和挖掘。

1.两个层面人员的管理准备

主要是对中上层管理人员和基层管理人员的培训和管理。中上层要进行相应的领导体制变革和知识培训,下层则可能要新设机构、增加专业技术人员和信息采集人员,并做好培训。为了响应大数据时代的到来,在管理层面,如美国政府在2009年任命了联邦政府首任首席信息官,负责指导联邦信息技术投资的政策和战略规划,负责监督联邦技术应用的有关支出,监管企业等,以确保在联邦政府范围内,系统互通互联、信息共享,确保信息安全和隐私,此外首席信息官还与首席技术官紧密合作来推进总统有关大数据应用的技术设想。[6]英国提出“相关部门必须重视大数据管理......需要任命两名三星上将担任“大数据”监督官,或者国防安全部门内部的大数据指挥官;这两名上将应该分别来自国防部和联合部队司令部,并分别负责两部分的大数据工作。”[7]而基层管理人员需要进行相应的培训。英国皇家联合军种国防研究所的“大数据化”建议帮助国防部门转变成为“大数据化”组织,对需要进行大数据化的部门安排培训,人员需要包括中层以下的管理人员和项目专家,即数据分析官;明确工业部门对大数据管理的价值和作用,包括作为后备力量和为国防安全领域提供专业技术人才。[8]

2.大数据应用的设施准备

设施准备主要指为大数据的应用提供基础设施,随着技术的不断发展,“传感器”将成为大数据应用中的重要一环。上世纪60年代以来,美国为预防风暴和海浪袭击而建立海浪检测系统。2005年,国家数据浮标中心在原有设备的基础上架设了大量新型海洋地理传感器,包括海浪流向传感器等。此项目传感器实时产生大量数据,用以实时监测海浪情况。按照该项目划分,全美海岸线被分为7个部分,每个区域的分支网路都是先独立布点,然后在区域联网的支持下,根据海浪运动的物理原理扩展联网。全部联网完成以后,整个监测网包括296个传感器:其中56个分布在远海,60个分布在大陆架外部,47个分布在大陆架内部,133个分布在海岸线附近,其中,有115个布点是2005年最新增加的布点,另外有128个布点刚刚完成海浪流向测量的升级。[9]这项计划产生极大的社会价值。根据数据统计,商业捕捞是全美最危险的职业之一。在2008年,该中心的报告称,该年度渔业从业者每十万人的死亡人数为155人,而全美所有行业的平均死亡人数仅为每十万人中4人。在渔业相关的所有死亡因素中,79%是由天气原因造成的,其中40%是由巨浪导致。[10]虽然无法具体统计海浪预测系统的预报拯救了多少人,但毋庸置疑的是,更好的实时海浪监测系统就意味着能救更多人。

大数据设施的准备还包括软件准备。软件的升级包括算法的更新,分析方法和数据处理方法的改进,多源数据的融合分析。在阿富汗,英军曾使用相关技术绘制一种“人肉炸弹地图”,将信息导入数据库,通过生物识别数据和图像来识别当地人口,判断关键信息,从而找出可能出现的恐怖分子。[11]在阿富汗战争最激烈的时期,美国国防高级研究计划局曾派遣数据科学家团队和可视化技术团队到阿富汗。在一个名为 “Nexus7”的计划中,这些团队将卫星数据与地面监控数据相融合,用以观察道路网中的交通流,以便作战人员定位并摧毁简易爆炸装置。[12]由于地面监控和卫星图像等硬件设备早为英美联军所部署,在阿富汗反恐作战中,图像处理技术、多源数据融合技术和可视化技术才是充分挖掘原有数据并使之产生价值的关键所在。

(二)事中响应

在事中响应阶段,大数据的应用能为政府、第三方组织或个人开展应急响应提供很大便利。对于政府而言,大数据化的应急管理意味着技术支撑基础上的融合与协作,它不但为协作带来很大便利性,也保证了日常业务连续性和应急处置及时性之间的平衡。对第三方组织或个人来说,大数据可以为应急管理提供更加便捷灵活的手段。

1.宏观和微观层面基于大数据信息流的多元应急合作

在宏观层面,整个应急响应可以分为决策指挥、现场应对和外界援助等三个层面,这之间以海量数据信息、高效计算能力和数据传输能力为基础,实现信息有效沟通和机器预测预判,进而帮助指挥部门协调各方、现场处置和救援、与外界通过信息沟通提供援助,实现多元化协作的应急处置(见图2)。

资料来源:作者整理

在微观层面,应对部门需要在应急处置和业务连续性之间保持平衡。大数据基础上的决策支持系统将成为强大的信息管理系统,能够做到实时报告,而且操作简易,能够同时集合多项关键指标的高效指挥决策辅助系统(见图3)。在大数据决策支持系统支撑下,交通、医护、警务、市政基础设施管理部门,需要及时沟通,为突发事件的处置提供有力的犯罪打击、充足的物力资源、及时的导航信息和必要的建筑图纸等。不同部门提供的信息,都需要纳入到大数据支撑的决策支持系统。如警务系统在接到报警后,将信息发送到决策支持系统,系统进行分析,确定事件的类型和位置,信息会在电子地图上显示,根据实践情况同时列出关键设备需求表,随后进行危机通报与应急响应。同时,交通部门将路况信息、可用资源和监控数据传输到决策支持系统,系统进行可视化操作,确定出通行路段和避免经过的路段,确定路线。医护部门根据决策支持系统的信息实时跟踪状态,可以有效调配可用资源,提高响应速度,与地理信息系统和地图系统相连以后,救护效率也会提高。

资料来源:作者整理

2.第三方组织或个人发布自发式地理信息

自发式地理信息是随着网络地图普及而出现的。普通民众可以在几乎没有相关专业知识的情况下,依靠自动或半自动的处理设备,使用地理信息系统绘制地图。特别在20世纪90年代以后,随着网络和GPS设备的普及,普通人进行定位和地图关联变得更加容易。这种方法在“大数据”概念出现之前就已有所应用。在谷歌的“我图”(My Maps)服务出现后,普通人也可以完成往常只有绘图师才能完成的任务。民众可以通过官方公布的坐标、自身获取的定位数据、或者网上未经证实的地理位置进行整理、关联、绘图,然后发布到网上。这一过程所使用的大多为开源数据,数据类型多样且大多非结构化。这种方法在应对南加州的森林大火时屡有应用,主要用来绘制火情地图以指导人们逃生和避险。

森林大火一直是南加州地区的梦魇,2007年7月到2009年5月期间发生的四场大火尤为惨烈。扎卡大火(Zaca Fire)始于2007年7月,持续两个月,这时居民主要依靠报纸、广播和电视新闻组成的政府信息系统了解火情,信息传递慢且获取被动。2008年7月,临近城市地带发生了盖普大火(Gap Fire),由无数帖子和网络相簿组成的自发式的理信息已经能为政府信息提供有益补充。到了2008年11月,圣巴巴拉附近的山上发生了“茶叶”大火(Tea Fire),网上迅速出现了各类自发式地理信息——文字报告、图片和视频。尽管谷歌没有立刻将这些信息整理发布,但是已经有一些当地报纸和社团组织办的网站来整理这些资料。同时一些志愿者发现,如果将搜集和编译后的分散信息整合进谷歌地图之类的电子地图,就可以制作出比政府信息还要方便快捷的灾害地图。[13]2009年5月,城市附近爆发杰苏斯塔大火(Jesusita Fire),许多组织和个人迅速建立了自发式地图站点,及时整合不断出现的自发式的地理信息和官方信息。政府公布的火灾边界图就是根据不断更新的市民报告做出的。在火灾后期,共有27个自发式在线网站,其中最广为人知的一个网站点击量超过60万。这个网站提供了许多灾害期间的必要信息,如火灾位置、疏散命令、紧急避难所位置等。[14]市民可以在政府通知之前自行选择撤离或采取防护措施。

由于政府信息缺乏良好的沟通渠道和证实信息的充分资源,所以其从产生到传递总是比自发式地理信息慢。尽管来自民间的信息也有可能产生错误,从而导致一些没有必要的撤离。但通过以上案例可以明显看出,自发式预报由误报而导致的不必要的撤离成本远比政府漏报的成本低,其应对灾害的重要意义也显而易见。[15]

在整个事中响应阶段,大数据的应用包括实时高效的数据信息收集、信息数据的迅速传递、多源数据集成处理、数据结果的可视化合成和最终实现机器或半机器化的辅助决策(详见图1)。数据收集方面根据应急管理主导者的不同有两种发展趋势:政府主导的专业应急管理团队信息收集逐渐专业化和高效化;以社会大众和社会媒体为依托的第三方应急管理力量则将信息收集方式发展为简单化和大众化的方式。信息传递方面大数据实时高效的特点要求信息传递方式不断创新,速度不断加快。数据的集成处理方面,根据大数据本身的特点,数据集成处理也具有巨量化、多样化和快速化的特点。可视化合成方面,应急管理所需的可视化结果必须简明直接和通俗易懂,第三方组织所使用的可视化方法还需要具有操作简便等特点。只有这样,大数据才能为事中响应提供快速而科学的机器决策或半机器决策。

(三)事后恢复与重建

大数据在应急管理事后的应用主要是在救援与恢复重建。目前在应急管理应用上比较新颖的是使用“分众(Crowd Sourcing)”的方式。“分众”是由大众通过网络分散完成工作任务,并通过整合后在网络上提供服务的一种方式。这个过程中使用的信息来源分散,体量巨大,并采取机器决策或半机器决策的方式利用信息。使用“分众”方法进行事后恢复与救援可以分为四个阶段:捕获信息,甄别加工信息、机器分析和迅速反应。捕获信息的方式可以是通过GPS定位发送自己的位置,也可以是通过社交网络发送某条文字信息。搜集到的信息会被汇集到分众平台上,这个过程可能需要机器与人协调完成。一些难以处理的信息会分配给志愿者进行加工,使之转变为计算机能识别的数据。如法语区内一条“推特”(Twitter)的信息可能并不适用于第三方软件处理,这时就需要志愿者先将这条信息翻译成英语,再将其中的关键信息提取分类,变得可为计算机处理。计算机会自动剔除无用和冗杂的信息,根据语义分析捕获含有有效信息的词条。随后,经过格式化的信息可以被计算机可视化或者作为统计资料加以利用,经过整合的信息可以发布在网上供众人浏览和使用。应急处置人员可以根据计算机的建议设计救援路线,配置救援装备,以最快速度抵达救援地点。

如2010年海地地震救援中,以“目击者”为代表的非营利网站利用“分众”方法起到了重要作用。总结分众式操作方法在应急管理中应用的流程图(见图4),可以看出,在灾害救援的过程中,需要有三个明确分工的角色完成整个操作:亲历地震的当地监测员、关联开放数据的网络操作员和救援组织中的信息官。

资料来源:作者整理

当地监测员通常是正在灾区的当事人。只要灾区当事人有一部能上网的手机,他就可以成为灾害应对活动中的一部分。当事人可以用多种方式发送求救信息,如推特(Twitter)或者脸书(Facebook)。推特可以通过话题标签将信息分类标注,经过分类标注的开源信息更容易被第三方识别和捕获。[16]

网络操作员通过捕获信息的第三方平台浏览到信息,并对信息进行处理。当求救信息是软件不支持的语言时,需要有另外的操作员(志愿者)完成翻译工作。随后,一条求救信息就可以被解析成几个不同的要素,从而由计算机进行识别和可视化。比如,“目击者”网站使用十个要素来描述一条信息,这些要素包括信息、标题、日期、位置(地点名称或者坐标)和需求等。这些要素是“海地目击者”团队设定的,每条信息中蕴含的需求都可以归入不同的类别中。然后,“目击者”报告平台利用CSV文档和简单信息聚合订阅(RSS Feed)的方式使得报告简易可读。最后,“目击者”还用一个交互式地图来公布实时报告。[17]

信息官指的是救援组织中负责搜集和处理信息的管理人员。信息官可以在网站上获取求救信息,从而迅速做出反应。信息官此刻至少可以确定目前急需的人道主义援助内容和地点。虽然开源信息的可信性并不能完全保证,但是,分众信息及其可视化在灾后最初的2-3天内,应用价值非常高。它可以用来指导灾情确认、救援实施以及其他可能需要协调的工作。[18]

尽管采用分众的方式对信息的捕获已经是非常便捷,但由于突发事件的紧急性,信息的实时接收与处理还是存在一定难度,分众平台上信息的真实性和准确性还需要确认,对信息官而言,如果能提前有时间学习平台的使用方法并了解其话语体系,灾后救援的效率将被大幅提高。目前,已有研究者通过相互关联的开源数据和分众处理的操作方法解决学习障碍、信息描述不清和真实性待定这三个问题。由于应急管理领域本身专业词汇缺乏且定义不清,在线共制平台的服务尚不完善,有时候也存在难以把信息官的数据端接入互联开源数据等问题。[19] 虽然该方法存在不足,按照目前的应用情况看,这种分众的方式潜力非常巨大。

三、对中国的启示

大数据的应用为我们提供了认识和解决问题的新思路,对中国有如下启示。

(一)制定国家大数据战略,加大对大数据投入

进入21世纪以来,特别是近年来,许多国家重视大数据在公共管理(包括应急管理)中的应用,并制定了国家级大数据战略。除美国的“大数据”战略外,澳大利亚在2013年8月明确提出了大数据国家战略并发布公共服务大数据政策[20];法国在2013年2月发布了《数字化路线图》,其中提到了支持大数据技术发展[21];日本在2013年6月正式公布了“创建最尖端IT国家宣言”,其中全面阐述了2013—2020年发展开放公共数据和大数据为核心的国家战略,旨在把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。[22]

许多国家还投入大量资金进行大数据研究,支持相关技术发展。英国在2013年1月宣布,将注资6亿英镑发展八类高新技术,其中投入1.89亿英镑用来发展大数据技术,以期在数据革命中占得先机。[23]法国则在2013年4月宣布,将投入1150万欧元用于支持7个未来投资项目,法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展。”[24]

各国的大数据战略表明,“大数据”并不仅仅是一个技术概念,它已经切实成为提高国家治理能力,改进公共管理水平乃至增强国家竞争力的重要因素。目前,广东省已经在我国率先试水大数据战略,并宣布要在近期开放一部分政府数据。[25]这是我国地方政府回应“大数据时代”的具体措施。但是相对于英、美等西方国家和日、韩等亚洲近邻而言,我国还没有形成完善的国家级大数据战略。

(二)制定大数据开放政策,逐步扩大数据共享范围

除了制定大数据国家战略外,还要重视制定配套的数据开放政策,如目前美国政府数据开放网站(Data.Gov)可供检索的数据集已超过10万项。继美国之后,很多国家也制定政策要求数据开放。可以说,政府数据公开与共享是大数据化改革的核心内容。2010年1月,英国政府建立的数据开放网站(Data.Gov.uk),除去地理信息之外,该网站建成之初便公布了3000多项民生数据。2011年4月,英国劳工关系部、商业部又启动了“我的数据”(MyData)项目,要求即使是商业公司收集的数据,如果记录的是公民个人信息,个人便有权查看和使用。目前已有十多家不同行业的大公司参与到此项目中。[26]

新加坡是亚洲地区的数据开放先行者。该国在2011年6月启用了新加坡政府数据开放平台(Data.Gov.sg),开放了60多个机构的8600个数据集,50%的数据是机器可读的。其中的OneMap是一个地理空间数据共享平台,目前有60多种不同的地图主题。利用这些数据,一些企业和政府部门已经开发了100多项应用,涉及停车信息、公共厕所、野猫管理等。[27]在亚洲,日本、韩国等国家也有类似计划。

从各国的趋势看,配合国家大数据战略制定数据开放政策和要求数据共享也是非常必要的。另外,“数据开放”已经成为各国共识,随着国际数据市场的逐步形成,没有符合国际标准的国家级数据公开标准,也就难以建立能与国际市场接轨的数据市场管理标准。“数据开放”俨然已经成为国际竞争力的一环,且欧美等国已抢占先机。所以无论从优化公共管理(包括应急管理)的角度,还是从增强国家竞争力的角度,抑或是规范数据市场的角度,由中央政府领衔制定国家级数据开放政策是非常必要的。

(三)探索大数据在应急管理领域中具体的应用形式

事前准备阶段,政府或其他部门需要为大数据的应用做出准备。在管理和权限设置上,有必要设置“大数据信息官”并赋予其具有改进组织流程的权限,以推进大数据在部门工作中的落实。在技术升级和设备使用方面,政府或其他部门要明确需要解决的问题,以需求为导向,进行一定设施的准备。

事中响应阶段,信息的有效聚合和快速传递是核心环节。政府或其他部门在使用大数据增强信息采集能力的同时,也要进行数据共享,建立统一的数据中心,以便在应急管理过程中提高效率。同时,在应急管理的事中响应阶段,指挥人员、专家技术人员和现场处置人员的联系也至关重要,建立高效的信息共享渠道也是很重要的方面。

事后处置和救援阶段,及时了解救援信息和对所获信息的处理最为重要。如果有明确的信号可以让应急处置人员快速了解需要救援的地点和所需救援内容,救援效率便可大幅度提高。大数据在事后处置的应用便是遵循这种逻辑:通过网络或者监控设备,采集需要救援的信息,用算法筛选整合这些信息,并将指令快速传达给应急处置人员,从而提高救援效率。

(四)完善隐私保护政策,注重公共安全和公民隐私之间的平衡

大数据时代,如何对公民个人隐私保护也很重要,最好能在公共安全和公民隐私之间达到平衡。2013年5月,爱德华?斯诺登披露了美国国家安全局自2007年实施的绝密电子监听计划,即“棱镜计划”(PRISM),允许FBI和NSA对包括微软、雅虎、谷歌、苹果在内的共九家IT巨头的数据进行监控和挖掘,直接或间接接触大量个人聊天日志、私人数据、语音通信、传输文件和社交网络数据。[28]尽管美国自我标榜“重视个人隐私”,但是公民个人的数据信息没有得到有效保护,引发了对“大数据时代”个人隐私的广泛讨论和关注。

2014年5月,美国总统办公室发布“大数据隐私”报告称,越来越多的传感设备和智能设备,使得政府或企业对个人信息的搜集无处不在。这些数据不但被用来进行实时分析,还被储存起来,成为一个人的“电子脚印”。[29]技术对个人隐私的威胁已经超出了原有法律框架。如果不对采集的个人信息使用进行有效规范,极有可能会出现大规模侵犯隐私的事件,从而使大数据信息采集成为一种“社会安全隐患”。因此,全面的数据隐私保护与最大的公共安全追求将是大数据时代面对的一个重要课题。

四、结语

“大数据”在应急管理中的应用具有很大潜力和价值,本文只是在理解大数据内涵的基础上,根据应急管理的特点,总结了大数据应用的基本框架和分析了实践案例等,由于大数据在应急管理中的应用本身就是一个交叉学科研究的主题,还有很大的研究空间,希望本文能引起相关应急管理研究者和实务人员的思考,为进一步促进大数据在我国应急管理中的应用提供更有质量的研究成果和实践。

关键字:谷歌多源数据文献标识码

本文摘自:人民网

x 大数据在应急管理中的应用 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据在应急管理中的应用

责任编辑:editor005 作者:马奔 毛庆铎 |来源:企业网D1Net  2015-03-11 13:35:18 本文摘自:人民网

当前大数据正在改变世界,而数据收集和分析则是提升应急管理功能的重要手段。在对大数据内涵和具体案例进行分析后就会发现,大数据在应急管理中的应用主要有大数据技术和大数据思维两种方式。在应急管理的事前准备、事中响应和事后救援与恢复的每一阶段都可以引入大数据的应用,每个阶段对大数据的应用程度也会因其需要应对内容的不同而有所差别。大数据的应用有助于提高应急管理效率、节省成本和减少损失。我国需要在大数据战略、大数据开放政策、大数据在应急管理中具体应用形式等方面做出部署与探索。

欧美一些国家已经开始把大数据运用到应急管理中,并取得一定成效,当前国内实务界和学术界虽然开始关注大数据的应用,但相关研究还比较缺乏。本文根据大数据的内涵,归纳了大数据在应急管理中的应用方式和基本框架,总结了大数据在应急管理中的实践案例,期望对我国大数据在应急管理中的应用和研究有所启示。

一、大数据的内涵和在应急管理中应用的基本框架

关于大数据的内涵并没有完全一致的理解,如按照麦肯锡全球研究所(McKinsey Global Institute)的定义,大数据指的是超出常规数据库软件工具所能捕获、存储、管理和分析的超大规模数据集。[1]也有的从数据集的特点入手,界定了大数据的三个主要特点,即常用的3V界定:规模性(Volume)、多样性(Variety)和高速性(Velocity)。[2]舍恩伯格在《大数据时代》中反复强调:大数据是人们获得新认知、创造新价值的源泉;大数据还是改变市场、组织机构以及政府与公民关系的方法[3],强调以大数据技术为基础的新思维和新方法。

由于对“大数据”的认识存在差别,综合不同的定义看,“大数据”在不同领域内包含三层含义,可以分别从现实和技术两方面加以阐释:第一层意义上的“大数据”指的是数据的巨量化和多样化,现实方面指的是海量数据,技术方面指的是海量数据存储;第二层意义上的“大数据”指的是大数据技术,现实方面指的是对已有或者新获取的大量数据进行分析和利用,技术方面是指云存储和云计算;第三层意义上的“大数据”指的是大数据思维或者大数据方法,现实方面指的是把目标全体作为样本的研究方式、模糊化的思维方式、侧重相关性的思考方式等理念,技术方面是指利用海量数据进行分析、处理并用以辅助决策,或者直接进行机器决策、半机器决策的全过程大数据方法,这种对大数据的认知方式涉及到“大数据项目”或“大数据技术应用”的认知,并由此可以延伸出大数据视角下的应急管理方式。

大数据在应急管理中的应用方式分为两部分:大数据技术和大数据思维。大数据技术既包括诸如数据仓库、数据集市和数据可视化等旧技术,也包括云存储和云计算等新技术;而大数据思维则是从海量数据中发现问题,用全样本的思维来思考问题,形成了模糊化、相关性和整体化的考虑方式。[4]大数据技术与思维相互融合和作用,共同形成了大数据的应用,并对包括应急管理在内的很多公共管理领域产生了巨大影响。如英国皇家联合军种国防研究所2013年的报告提出,大数据的应用包含四个特征:快速的收集、分析、决策和反应机制;在分析和结论方面有极高的可信度;无论是在个人还是群体的行为预测方面都应该更有预见性和更高的准确度;重视数据和充分利用,最好是能够多次使用数据。[5]

按照突发事件发生的时间顺序,整个应急管理大致可以分为事前、事中和事后三个阶段,包括预防准备、监测预警、应急处置、善后恢复等多个环节。由于当前大数据在应急管理中大多处于技术应用阶段,并没有针对应急管理中大数据的应用进行严格分类,因此本文根据应急管理最简单的时间序列划分法,探讨了大数据在应急管理中事前、事中和事后应用的基本框架(见图1)。

当然,由于应急管理针对的事件类型不同,并非所有的应急管理领域都会涉及到大数据在三个过程中的应用。有时候可能并不需要进行数据的重新收集和硬件系统的整合,而只需要进行管理模式和思维的变化,就可以形成新的大数据应用方式,这也是大数据在应急管理甚至是公共管理应用中不同于纯技术导向应用的核心所在。

资料来源:作者整理

二、大数据在应急管理中应用的具体分析和实践

由于应急管理三个阶段的任务不同,且不同性质的突发事件也有发生机理和破坏方式的差异,针对不同突发事件进行应急管理时,所侧重的应对阶段也有所不同。如地震、海啸等发生突然,现场反应时间很短,进行“事中响应”非常困难,需要着重预防和救援;而森林火灾等预防困难,救援难度大,现场应对更为重要。因此,就需要根据突发事件的不同特点,在不同阶段应用大数据,可以起到事半功倍的效果。

(一)事前准备

在事前准备阶段,需要为大数据的应用进行相应的管理和设施准备。管理准备指的是与大数据管理、大数据方法相匹配的人事准备和管理提升。设施准备指的是大数据应用所需要的硬件和软件设施。硬件设施主要涉及新技术背景下的数据采集,而软件设施不但涉及到新数据的采集,也可以针对旧有数据进行分析和挖掘。

1.两个层面人员的管理准备

主要是对中上层管理人员和基层管理人员的培训和管理。中上层要进行相应的领导体制变革和知识培训,下层则可能要新设机构、增加专业技术人员和信息采集人员,并做好培训。为了响应大数据时代的到来,在管理层面,如美国政府在2009年任命了联邦政府首任首席信息官,负责指导联邦信息技术投资的政策和战略规划,负责监督联邦技术应用的有关支出,监管企业等,以确保在联邦政府范围内,系统互通互联、信息共享,确保信息安全和隐私,此外首席信息官还与首席技术官紧密合作来推进总统有关大数据应用的技术设想。[6]英国提出“相关部门必须重视大数据管理......需要任命两名三星上将担任“大数据”监督官,或者国防安全部门内部的大数据指挥官;这两名上将应该分别来自国防部和联合部队司令部,并分别负责两部分的大数据工作。”[7]而基层管理人员需要进行相应的培训。英国皇家联合军种国防研究所的“大数据化”建议帮助国防部门转变成为“大数据化”组织,对需要进行大数据化的部门安排培训,人员需要包括中层以下的管理人员和项目专家,即数据分析官;明确工业部门对大数据管理的价值和作用,包括作为后备力量和为国防安全领域提供专业技术人才。[8]

2.大数据应用的设施准备

设施准备主要指为大数据的应用提供基础设施,随着技术的不断发展,“传感器”将成为大数据应用中的重要一环。上世纪60年代以来,美国为预防风暴和海浪袭击而建立海浪检测系统。2005年,国家数据浮标中心在原有设备的基础上架设了大量新型海洋地理传感器,包括海浪流向传感器等。此项目传感器实时产生大量数据,用以实时监测海浪情况。按照该项目划分,全美海岸线被分为7个部分,每个区域的分支网路都是先独立布点,然后在区域联网的支持下,根据海浪运动的物理原理扩展联网。全部联网完成以后,整个监测网包括296个传感器:其中56个分布在远海,60个分布在大陆架外部,47个分布在大陆架内部,133个分布在海岸线附近,其中,有115个布点是2005年最新增加的布点,另外有128个布点刚刚完成海浪流向测量的升级。[9]这项计划产生极大的社会价值。根据数据统计,商业捕捞是全美最危险的职业之一。在2008年,该中心的报告称,该年度渔业从业者每十万人的死亡人数为155人,而全美所有行业的平均死亡人数仅为每十万人中4人。在渔业相关的所有死亡因素中,79%是由天气原因造成的,其中40%是由巨浪导致。[10]虽然无法具体统计海浪预测系统的预报拯救了多少人,但毋庸置疑的是,更好的实时海浪监测系统就意味着能救更多人。

大数据设施的准备还包括软件准备。软件的升级包括算法的更新,分析方法和数据处理方法的改进,多源数据的融合分析。在阿富汗,英军曾使用相关技术绘制一种“人肉炸弹地图”,将信息导入数据库,通过生物识别数据和图像来识别当地人口,判断关键信息,从而找出可能出现的恐怖分子。[11]在阿富汗战争最激烈的时期,美国国防高级研究计划局曾派遣数据科学家团队和可视化技术团队到阿富汗。在一个名为 “Nexus7”的计划中,这些团队将卫星数据与地面监控数据相融合,用以观察道路网中的交通流,以便作战人员定位并摧毁简易爆炸装置。[12]由于地面监控和卫星图像等硬件设备早为英美联军所部署,在阿富汗反恐作战中,图像处理技术、多源数据融合技术和可视化技术才是充分挖掘原有数据并使之产生价值的关键所在。

(二)事中响应

在事中响应阶段,大数据的应用能为政府、第三方组织或个人开展应急响应提供很大便利。对于政府而言,大数据化的应急管理意味着技术支撑基础上的融合与协作,它不但为协作带来很大便利性,也保证了日常业务连续性和应急处置及时性之间的平衡。对第三方组织或个人来说,大数据可以为应急管理提供更加便捷灵活的手段。

1.宏观和微观层面基于大数据信息流的多元应急合作

在宏观层面,整个应急响应可以分为决策指挥、现场应对和外界援助等三个层面,这之间以海量数据信息、高效计算能力和数据传输能力为基础,实现信息有效沟通和机器预测预判,进而帮助指挥部门协调各方、现场处置和救援、与外界通过信息沟通提供援助,实现多元化协作的应急处置(见图2)。

资料来源:作者整理

在微观层面,应对部门需要在应急处置和业务连续性之间保持平衡。大数据基础上的决策支持系统将成为强大的信息管理系统,能够做到实时报告,而且操作简易,能够同时集合多项关键指标的高效指挥决策辅助系统(见图3)。在大数据决策支持系统支撑下,交通、医护、警务、市政基础设施管理部门,需要及时沟通,为突发事件的处置提供有力的犯罪打击、充足的物力资源、及时的导航信息和必要的建筑图纸等。不同部门提供的信息,都需要纳入到大数据支撑的决策支持系统。如警务系统在接到报警后,将信息发送到决策支持系统,系统进行分析,确定事件的类型和位置,信息会在电子地图上显示,根据实践情况同时列出关键设备需求表,随后进行危机通报与应急响应。同时,交通部门将路况信息、可用资源和监控数据传输到决策支持系统,系统进行可视化操作,确定出通行路段和避免经过的路段,确定路线。医护部门根据决策支持系统的信息实时跟踪状态,可以有效调配可用资源,提高响应速度,与地理信息系统和地图系统相连以后,救护效率也会提高。

资料来源:作者整理

2.第三方组织或个人发布自发式地理信息

自发式地理信息是随着网络地图普及而出现的。普通民众可以在几乎没有相关专业知识的情况下,依靠自动或半自动的处理设备,使用地理信息系统绘制地图。特别在20世纪90年代以后,随着网络和GPS设备的普及,普通人进行定位和地图关联变得更加容易。这种方法在“大数据”概念出现之前就已有所应用。在谷歌的“我图”(My Maps)服务出现后,普通人也可以完成往常只有绘图师才能完成的任务。民众可以通过官方公布的坐标、自身获取的定位数据、或者网上未经证实的地理位置进行整理、关联、绘图,然后发布到网上。这一过程所使用的大多为开源数据,数据类型多样且大多非结构化。这种方法在应对南加州的森林大火时屡有应用,主要用来绘制火情地图以指导人们逃生和避险。

森林大火一直是南加州地区的梦魇,2007年7月到2009年5月期间发生的四场大火尤为惨烈。扎卡大火(Zaca Fire)始于2007年7月,持续两个月,这时居民主要依靠报纸、广播和电视新闻组成的政府信息系统了解火情,信息传递慢且获取被动。2008年7月,临近城市地带发生了盖普大火(Gap Fire),由无数帖子和网络相簿组成的自发式的理信息已经能为政府信息提供有益补充。到了2008年11月,圣巴巴拉附近的山上发生了“茶叶”大火(Tea Fire),网上迅速出现了各类自发式地理信息——文字报告、图片和视频。尽管谷歌没有立刻将这些信息整理发布,但是已经有一些当地报纸和社团组织办的网站来整理这些资料。同时一些志愿者发现,如果将搜集和编译后的分散信息整合进谷歌地图之类的电子地图,就可以制作出比政府信息还要方便快捷的灾害地图。[13]2009年5月,城市附近爆发杰苏斯塔大火(Jesusita Fire),许多组织和个人迅速建立了自发式地图站点,及时整合不断出现的自发式的地理信息和官方信息。政府公布的火灾边界图就是根据不断更新的市民报告做出的。在火灾后期,共有27个自发式在线网站,其中最广为人知的一个网站点击量超过60万。这个网站提供了许多灾害期间的必要信息,如火灾位置、疏散命令、紧急避难所位置等。[14]市民可以在政府通知之前自行选择撤离或采取防护措施。

由于政府信息缺乏良好的沟通渠道和证实信息的充分资源,所以其从产生到传递总是比自发式地理信息慢。尽管来自民间的信息也有可能产生错误,从而导致一些没有必要的撤离。但通过以上案例可以明显看出,自发式预报由误报而导致的不必要的撤离成本远比政府漏报的成本低,其应对灾害的重要意义也显而易见。[15]

在整个事中响应阶段,大数据的应用包括实时高效的数据信息收集、信息数据的迅速传递、多源数据集成处理、数据结果的可视化合成和最终实现机器或半机器化的辅助决策(详见图1)。数据收集方面根据应急管理主导者的不同有两种发展趋势:政府主导的专业应急管理团队信息收集逐渐专业化和高效化;以社会大众和社会媒体为依托的第三方应急管理力量则将信息收集方式发展为简单化和大众化的方式。信息传递方面大数据实时高效的特点要求信息传递方式不断创新,速度不断加快。数据的集成处理方面,根据大数据本身的特点,数据集成处理也具有巨量化、多样化和快速化的特点。可视化合成方面,应急管理所需的可视化结果必须简明直接和通俗易懂,第三方组织所使用的可视化方法还需要具有操作简便等特点。只有这样,大数据才能为事中响应提供快速而科学的机器决策或半机器决策。

(三)事后恢复与重建

大数据在应急管理事后的应用主要是在救援与恢复重建。目前在应急管理应用上比较新颖的是使用“分众(Crowd Sourcing)”的方式。“分众”是由大众通过网络分散完成工作任务,并通过整合后在网络上提供服务的一种方式。这个过程中使用的信息来源分散,体量巨大,并采取机器决策或半机器决策的方式利用信息。使用“分众”方法进行事后恢复与救援可以分为四个阶段:捕获信息,甄别加工信息、机器分析和迅速反应。捕获信息的方式可以是通过GPS定位发送自己的位置,也可以是通过社交网络发送某条文字信息。搜集到的信息会被汇集到分众平台上,这个过程可能需要机器与人协调完成。一些难以处理的信息会分配给志愿者进行加工,使之转变为计算机能识别的数据。如法语区内一条“推特”(Twitter)的信息可能并不适用于第三方软件处理,这时就需要志愿者先将这条信息翻译成英语,再将其中的关键信息提取分类,变得可为计算机处理。计算机会自动剔除无用和冗杂的信息,根据语义分析捕获含有有效信息的词条。随后,经过格式化的信息可以被计算机可视化或者作为统计资料加以利用,经过整合的信息可以发布在网上供众人浏览和使用。应急处置人员可以根据计算机的建议设计救援路线,配置救援装备,以最快速度抵达救援地点。

如2010年海地地震救援中,以“目击者”为代表的非营利网站利用“分众”方法起到了重要作用。总结分众式操作方法在应急管理中应用的流程图(见图4),可以看出,在灾害救援的过程中,需要有三个明确分工的角色完成整个操作:亲历地震的当地监测员、关联开放数据的网络操作员和救援组织中的信息官。

资料来源:作者整理

当地监测员通常是正在灾区的当事人。只要灾区当事人有一部能上网的手机,他就可以成为灾害应对活动中的一部分。当事人可以用多种方式发送求救信息,如推特(Twitter)或者脸书(Facebook)。推特可以通过话题标签将信息分类标注,经过分类标注的开源信息更容易被第三方识别和捕获。[16]

网络操作员通过捕获信息的第三方平台浏览到信息,并对信息进行处理。当求救信息是软件不支持的语言时,需要有另外的操作员(志愿者)完成翻译工作。随后,一条求救信息就可以被解析成几个不同的要素,从而由计算机进行识别和可视化。比如,“目击者”网站使用十个要素来描述一条信息,这些要素包括信息、标题、日期、位置(地点名称或者坐标)和需求等。这些要素是“海地目击者”团队设定的,每条信息中蕴含的需求都可以归入不同的类别中。然后,“目击者”报告平台利用CSV文档和简单信息聚合订阅(RSS Feed)的方式使得报告简易可读。最后,“目击者”还用一个交互式地图来公布实时报告。[17]

信息官指的是救援组织中负责搜集和处理信息的管理人员。信息官可以在网站上获取求救信息,从而迅速做出反应。信息官此刻至少可以确定目前急需的人道主义援助内容和地点。虽然开源信息的可信性并不能完全保证,但是,分众信息及其可视化在灾后最初的2-3天内,应用价值非常高。它可以用来指导灾情确认、救援实施以及其他可能需要协调的工作。[18]

尽管采用分众的方式对信息的捕获已经是非常便捷,但由于突发事件的紧急性,信息的实时接收与处理还是存在一定难度,分众平台上信息的真实性和准确性还需要确认,对信息官而言,如果能提前有时间学习平台的使用方法并了解其话语体系,灾后救援的效率将被大幅提高。目前,已有研究者通过相互关联的开源数据和分众处理的操作方法解决学习障碍、信息描述不清和真实性待定这三个问题。由于应急管理领域本身专业词汇缺乏且定义不清,在线共制平台的服务尚不完善,有时候也存在难以把信息官的数据端接入互联开源数据等问题。[19] 虽然该方法存在不足,按照目前的应用情况看,这种分众的方式潜力非常巨大。

三、对中国的启示

大数据的应用为我们提供了认识和解决问题的新思路,对中国有如下启示。

(一)制定国家大数据战略,加大对大数据投入

进入21世纪以来,特别是近年来,许多国家重视大数据在公共管理(包括应急管理)中的应用,并制定了国家级大数据战略。除美国的“大数据”战略外,澳大利亚在2013年8月明确提出了大数据国家战略并发布公共服务大数据政策[20];法国在2013年2月发布了《数字化路线图》,其中提到了支持大数据技术发展[21];日本在2013年6月正式公布了“创建最尖端IT国家宣言”,其中全面阐述了2013—2020年发展开放公共数据和大数据为核心的国家战略,旨在把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。[22]

许多国家还投入大量资金进行大数据研究,支持相关技术发展。英国在2013年1月宣布,将注资6亿英镑发展八类高新技术,其中投入1.89亿英镑用来发展大数据技术,以期在数据革命中占得先机。[23]法国则在2013年4月宣布,将投入1150万欧元用于支持7个未来投资项目,法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展。”[24]

各国的大数据战略表明,“大数据”并不仅仅是一个技术概念,它已经切实成为提高国家治理能力,改进公共管理水平乃至增强国家竞争力的重要因素。目前,广东省已经在我国率先试水大数据战略,并宣布要在近期开放一部分政府数据。[25]这是我国地方政府回应“大数据时代”的具体措施。但是相对于英、美等西方国家和日、韩等亚洲近邻而言,我国还没有形成完善的国家级大数据战略。

(二)制定大数据开放政策,逐步扩大数据共享范围

除了制定大数据国家战略外,还要重视制定配套的数据开放政策,如目前美国政府数据开放网站(Data.Gov)可供检索的数据集已超过10万项。继美国之后,很多国家也制定政策要求数据开放。可以说,政府数据公开与共享是大数据化改革的核心内容。2010年1月,英国政府建立的数据开放网站(Data.Gov.uk),除去地理信息之外,该网站建成之初便公布了3000多项民生数据。2011年4月,英国劳工关系部、商业部又启动了“我的数据”(MyData)项目,要求即使是商业公司收集的数据,如果记录的是公民个人信息,个人便有权查看和使用。目前已有十多家不同行业的大公司参与到此项目中。[26]

新加坡是亚洲地区的数据开放先行者。该国在2011年6月启用了新加坡政府数据开放平台(Data.Gov.sg),开放了60多个机构的8600个数据集,50%的数据是机器可读的。其中的OneMap是一个地理空间数据共享平台,目前有60多种不同的地图主题。利用这些数据,一些企业和政府部门已经开发了100多项应用,涉及停车信息、公共厕所、野猫管理等。[27]在亚洲,日本、韩国等国家也有类似计划。

从各国的趋势看,配合国家大数据战略制定数据开放政策和要求数据共享也是非常必要的。另外,“数据开放”已经成为各国共识,随着国际数据市场的逐步形成,没有符合国际标准的国家级数据公开标准,也就难以建立能与国际市场接轨的数据市场管理标准。“数据开放”俨然已经成为国际竞争力的一环,且欧美等国已抢占先机。所以无论从优化公共管理(包括应急管理)的角度,还是从增强国家竞争力的角度,抑或是规范数据市场的角度,由中央政府领衔制定国家级数据开放政策是非常必要的。

(三)探索大数据在应急管理领域中具体的应用形式

事前准备阶段,政府或其他部门需要为大数据的应用做出准备。在管理和权限设置上,有必要设置“大数据信息官”并赋予其具有改进组织流程的权限,以推进大数据在部门工作中的落实。在技术升级和设备使用方面,政府或其他部门要明确需要解决的问题,以需求为导向,进行一定设施的准备。

事中响应阶段,信息的有效聚合和快速传递是核心环节。政府或其他部门在使用大数据增强信息采集能力的同时,也要进行数据共享,建立统一的数据中心,以便在应急管理过程中提高效率。同时,在应急管理的事中响应阶段,指挥人员、专家技术人员和现场处置人员的联系也至关重要,建立高效的信息共享渠道也是很重要的方面。

事后处置和救援阶段,及时了解救援信息和对所获信息的处理最为重要。如果有明确的信号可以让应急处置人员快速了解需要救援的地点和所需救援内容,救援效率便可大幅度提高。大数据在事后处置的应用便是遵循这种逻辑:通过网络或者监控设备,采集需要救援的信息,用算法筛选整合这些信息,并将指令快速传达给应急处置人员,从而提高救援效率。

(四)完善隐私保护政策,注重公共安全和公民隐私之间的平衡

大数据时代,如何对公民个人隐私保护也很重要,最好能在公共安全和公民隐私之间达到平衡。2013年5月,爱德华?斯诺登披露了美国国家安全局自2007年实施的绝密电子监听计划,即“棱镜计划”(PRISM),允许FBI和NSA对包括微软、雅虎、谷歌、苹果在内的共九家IT巨头的数据进行监控和挖掘,直接或间接接触大量个人聊天日志、私人数据、语音通信、传输文件和社交网络数据。[28]尽管美国自我标榜“重视个人隐私”,但是公民个人的数据信息没有得到有效保护,引发了对“大数据时代”个人隐私的广泛讨论和关注。

2014年5月,美国总统办公室发布“大数据隐私”报告称,越来越多的传感设备和智能设备,使得政府或企业对个人信息的搜集无处不在。这些数据不但被用来进行实时分析,还被储存起来,成为一个人的“电子脚印”。[29]技术对个人隐私的威胁已经超出了原有法律框架。如果不对采集的个人信息使用进行有效规范,极有可能会出现大规模侵犯隐私的事件,从而使大数据信息采集成为一种“社会安全隐患”。因此,全面的数据隐私保护与最大的公共安全追求将是大数据时代面对的一个重要课题。

四、结语

“大数据”在应急管理中的应用具有很大潜力和价值,本文只是在理解大数据内涵的基础上,根据应急管理的特点,总结了大数据应用的基本框架和分析了实践案例等,由于大数据在应急管理中的应用本身就是一个交叉学科研究的主题,还有很大的研究空间,希望本文能引起相关应急管理研究者和实务人员的思考,为进一步促进大数据在我国应急管理中的应用提供更有质量的研究成果和实践。

关键字:谷歌多源数据文献标识码

本文摘自:人民网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^