如何优化公司的大数据以备将来使用

责任编辑:jackye

作者:Harris编译

2017-09-19 09:34:27

摘自:机房360

摘要:大数据挖掘通常从高水平的数据抽象开始,然后随着公司从中获得更多信息,逐渐加大挖掘数据的深度。大数据挖掘通常从高水平的数据抽象开始,然后随着公司从中获得更多信息,逐渐加大挖掘数据的深度。

通过了解最低级别的数据的全部价值,可以让公司在以后更加充分地利用数据。

大数据挖掘通常从高水平的数据抽象开始,然后随着公司从中获得更多信息,逐渐加大挖掘数据的深度。

这种方法行之有效,在许多不同类型的应用程序中都可以操作。

例如,地理信息系统和制图系统使用数据让一幅大地图可视化,然后集中在一个特定的点或位置。当数据分析人员深入研究到这个位置时,他们可以查看其他可能附在该位置的相关数据,例如居住在该地点的人口统计数据,或该地点的交通事故数量。

然而,还有另一种方法,它能够解开大数据的隐藏价值。这种方法实际上是从数据的最底层开始,然后再向更复杂的数据结构开展工作,以提供对管理人员和工作人员有帮助的数据洞察力。

以下是一个例子:建筑,工程和地理空间解决方案提供商Woolpert公司研究与开发总监,副总裁Layton Hobbs表示:“显示器可以显示一个点的可见颜色,也可以显示可用于测量营养健康的红外值。”

Hobbs阐述了农业和林业公司超越基本的地理空间数据的潜力,他们收集和解开隐藏在地理空间数据(如地形,土壤,地面覆盖,植物健康和树冠数据)中隐藏的宝藏。

“多数地理空间数据是为一个特定的原因或需要而创建的,但是在地理空间数据中还有更多的信息未得到充分利用或未被承认。”Woolpert公司地理空间学科带头人JoeCantz补充说。“特别是使用较新的技术,数据丰富的信息呈指数级增长,但在这一点上我们只使用了一小部分。”

据Woolpert公司的技术人员介绍,地理空间数据像素能够存储比传统256位8位图像更广泛的数值。Hobbs说:“这些现代系统通常以高达12位的数据(红色,绿色,蓝色和红外线)存储四个频带,每个频带约有4000个数值。“结合这四个图像波段,可以在一个空间位置创建256万亿种可能的组合!这绝对秒杀大多数应用程序的能力,但显示了图像大数据应用的潜力。

为什么这对公司大数据项目很重要?

物联网数据,如传感器捕获和发射的数据马上就会出现。

使用物联网,您可以从自己的自顶向下的大数据计划和分析开始,利用从无人机上的传感器发送的数据和图像。但是如果查看无人机发送的数据的每个像素,发现有额外的数据值被捕获,可以回答现在不会令人感兴趣的问题,但可能在未来进行解答。

以下是如何优化当前和将来使用的数据:

分析从给定的数据单位(例如像素)可以提取的内容,即使可能不在乎现在的所有这些信息。

这可以很容易地完成。参考LaytonHobbs的例子,也许人们目前并不关心森林的健康状况,但是如果有一天想在收获后恢复这片森林,那么了解一些有关森林健康的信息将会有所帮助。在这一点上,知道从管理中的大数据中可以获得的一切都是重要的。

在大数据的最低单位列出可能的信息捕获

如果正在处理一个像素,并且知道森林健康和地形可以从这些数据进行分析,并记录下来,如果当您需要的时候,记住数据的信息潜力并激活它要容易得多。

不要迷失在细节中

虽然重要的是在最低级别的数据中将大数据的信息潜力进行编目,但重要的是不要迷失在细节中。如果目前的工作是简单的一个森林地图,简单确定森林砍伐的情况,需要找出收获木材的立场,坚持下去。不要进行与手头任务无关的其他类型的数据探索。

预期的教训

当一家银行营销部门通过根据年龄组识别某些地区的人员,然后将检测产品与客户所在的各个生命周期阶段相关联,将人口统计信息用于其一个检查活动。之后,为了改善效果,可以增加了针对检查活动中人员的职业和年龄。

这是公司常见的情况。他们想回到数据,看看他们是否能添加更多的信息,以便他们能改进结果。

通过对数据的最底层的潜在信息收益进行评估和编目,数据分析师可以准备开放数据以进行更全面的分析,从而提供公司下一步要提出的问题的答案。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号