当前位置:大数据业界动态 → 正文

文化、自动化和自助服务:大数据成功的关键

责任编辑:cres 作者:Charles McLellan 译者:HERO |来源:企业网D1Net  2017-10-18 11:39:09 原创文章 企业网D1Net

Infogix公司总裁兼首席执行官Sumit Nijhawan介绍了许多大数据项目失败的原因,以及企业如何充分利用这一领域的投资。
 
最近,调研机构Tech Pro Research公司与数据完整性和数据治理解决方案厂商Infogix公司首席执行官兼总裁Sumit Nijhawan对大数据的状态和发展进行了交流与探讨。该公司创建于30年前,原名为Unitech Systems。在大数据时代开始之后,2005年公司更名为Infogix。该公司最近的企业并购是2017年2月收购了Data3Sixty公司,这是一家专注于云计算数据治理的行业领先的提供商。
 
早在2016年11月,Infogix公司就发布了2017年十大变革性数据趋势,并于今年8月又一次进行了更新。人们对Infogix公司针对今后趋势发展的再次预测十分关注。为此,调研机构Tech Pro Research公司对Infogix公司总裁兼首席执行官Sumit Nijhawan进行了采访。
 
Tech Pro:Infogix公司最近更新了2017年的大数据预测,这是因为有了意想不到的发展还是其他原因?
 
Nijhawan:“在今年前六个月,我们在与客户合作中制定了我们的市场战略和产品策略,而根据我们和客户对市场的观察,对于发展趋势的更新是有意义的,特别是在大数据治理领域。
 
我们对几乎所有的客户都有一个大数据倡议,许多项目都开始进行了更多的投资和动作,但是他们发现所取得的进展和从投资中获得的价值,往往不符合最初的期望。
 
我们在就一些事情正在与客户合作,我们认为可以变革的是数据治理,数据准备,自助服务和较小的数据湖部署的组合。”
 
Tech Pro:你所说的从大数据中获得洞察力的主要瓶颈实际上是如何发现所拥有的具有价值的数据,并将其用于分析吗?
 
Nijhawan:“是的,大部分的重点是提供存储环境——Hadoop,并让每个人都可以将任何数据转储到其中。在这里要考虑两件事情:一,他们到底向Hadoop导入的目标和项目到底是什么?第二,即使数据存在,它不受管理,是不可搜索的,是不能发现的,它不是以某种方式吸引消费者的数据,并帮助他们获取价值,并非常依赖IT部门 ,仍然需要技术人员来处理,而这不是客户从这些投资中获得价值的方法。”
 
Tech Pro:你所提到的Hadoop仍然是大数据领域的关键产品吗?
 
Nijhawan:“大数据不仅仅是关于Hadoop的,而且我也认为Hadoop将一直是保持大数据业务的组成部分,因为有足够的投入。而且实际上,它作为一种技术满足了人们的需求,但是它也有一个整体生态系统:例如Spark,还有Cassandra,MongoDB和HBase这些数据库,以及所有Hadoop提供的存储和框架,这就是这些技术的发展情况。”
 
Tech Pro:说,大多数公司仍然努力从大数据技术投资中获取商业价值吗?
 
Nijhawan:“是的,没错,因为这一切都是作为一个实验开始的,而且有些实验效果很不错。但是如何将这些实验转化成真正能够以可持续的方式提供企业洞察力的东西?这就是每个人的努力方向。
 
这就像是在说:‘我拥有一大堆产品,我将存放产品的仓库设置在了一个偏远的地方,现在告诉我你想要什么,我会把产品发送给你。’但人们不知道这个仓库里面有什么,或者怎么做,因此需要电子商务,例如亚马逊风格的网站,亚马逊有很多仓库,但它之所以能起作用,是因为他们把电子商务模式整合在一起:任何人都可以访问,找到他们想要的东西,将其放到购物车上,为其分配价值——亚马逊甚至向消费者推荐他们应该尝试的东西,在这个背后有一个供应链在发挥作用,将产品运送给消费者。
 
大数据需要什么?缺少了什么?缺少的是亚马逊这样的顶级网站,以及其背后的供应链的自动化。”
 
Tech Pro:那么,许多组织的业务和IT之间的关系是否存在着一种脱节呢?组织需要培养一种“数据文化”吗?在这种情况下,业务部门知道如何询问数据的正确问题,并产生自己的见解吗?
 
Nijhawan:“我们当然需要更多的业务驱动的数据文化。这并不是IT人员不愿分享,只是他们拥有这些工具,他们认为自己做得很好,但他们并不真正知道其最终的目标是什么,这就是为什么脱节的原因。除非它是一个商业驱动的举措,否则它很难实现任何有意义的事情。”
 
Tech Pro:许多组织是否缺少可以连接企业管理层与业务部门以及IT部门的首席数据官(CDO)这个环节?
 
Nijhawan:“这个环节很可能是缺失的,但我不会说这只是一个职位的问题。刚才提到的‘数据文化’是关于人、过程和技术以及数据本身的。它实际上是关于端到端的过程:例如如何处理数据的方法,所要处理的数据,以及交付数据的方式。这个端到端的过程需要由业务发起人发起,这当然可以是首席数据官(CDO)来实施。但如今首席数据官面临的问题是,在许多组织中,这几乎是一个尴尬的职位:如果首席数据官(CDO)具有一定影响力,最终将成为向供应商去推销他们技术和产品的人,而不是没有成为实现业务目标的人。
 
如今的许多首席数据官都是来自IT部门,但企业真的需要一个有商业背景的人。”
 
Tech Pro:当与客户沟通时,你认为目前最需要哪些数据相关技能?一些分析人士发现企业对数据科学家的需求有所下降,这是真的吗?
 
Nijhawan:“我认为这种需求正在减少,但这并不是因为数据科学家过剩。更重要的是,现在的数据科学家无法提供企业想要的价值。于是问题就变成了:‘如果我没有得到价值,那么招募更多的数据科学家又有什么意义呢?’‘为什么我不能让公司的业务人员和日常数据分析师来承担这项工作?’坦白地说,这些人就可以胜任,由于80%的数据科学家能够解决的问题可以通过20%的机器算法来解决,而且这些算法能够采用易于使用的方式,数据分析师和业务分析师可以将其纳入运营和业务流程,其结果导致企业对数据科学家的需求下降。”
 
Tech Pro:人们听到很多关于“自助服务”的分析,而不再需要更多的专家参与,你认为其发展方向是什么?
 
Nijhawan:“按照这些原则,我们正在与客户进行的工作是查看他们已经拥有数据湖计划 - Hadoop,Cloudera和所有这些数据的大数据,并给出建议,‘也许你不需要这些开源技术,不必花费数月时间和数百万美元的费用,我们将为你提供端到端的设备,实现完全自助的大数据服务,这一切都是集成的。你所需要做的只是消费数据,让你们的业务人员和数据科学家的工作压力得以缓解。’而这在市场上有很大的吸引力。”
 
Tech Pro:如今,几乎每个人都在谈论机器学习和人工智能,你认为这些技术将在大数据方面发挥什么作用?
 
Nijhawan:“机器学习和人工智能的应用和发展已经存在一段时间了,但是现在还有很多争论,但是就像我之前说的那样:80%的问题可以通过20%的机器学习算法来解决,如分割,推荐,分类,回归,以及预测。大数据质量是具有更大吸引力的一个领域,传统上数据质量一直在确定匹配规则和重复规则,以及所有这些内容,现在数据量十分庞大,人们在数据湖中投入更多的数据,他们不一定知道确切的规则是什么,而只是使用机器学习算法,例如分段和分类来查找异常值,这就是机器学习已经带来了很多价值的原因,但是同样,企业并不需要经验和知识非常丰富的数据科学家来做到这一点。”
 
Tech Pro:2017年的十大趋势之一是“信息学的转型和识别数据价值的能力”。你如何定义“信息学”和“数据科学/工程”之间的差异?
 
Nijhawan:“这里的主要区别是,企业必须按照传统的定义,将数据的货币化和数据的价值添加到信息学中,一旦加入,我认为这是真正的信息学,而且每个人都在谈论数据的价值时,他们非常主观地进行谈论,我们所做的一些研究,实际上把数据看作是资产负债表的组成部分,在这一方面,数据既是一种资产,也可以是一种负债。因此,从企业所拥有的并赋予其价值不同的数据集的角度来看:是什么使它成为一种资产,又是什么使它成为一种负债,并为其带来价值。这是我们的一个研究领域。”
 
Tech Pro:你如何看待广泛应用的物联网设备将更多的数据输入到公司的系统中,这将如何改变大数据市场?
 
Nijhawan:“物联网设备现在是大数据投资的主要驱动力,我认为这项技术已经可以解释这些数据,尽管人们确实需要更多的商业头脑来理解它,并理解其中的含义。这就是发生的进化:数据能告诉人们什么是其不知道的,而不是要求某人知道应该发生什么,或者可能发生什么事。自动发现结论和解释是我认为需要做更多工作的地方。”
 
Tech Pro:你认为大数据技术的发展将会在2017年减缓吗?今年是一个分水岭吗?
 
Nijhawan:“不,我认为2017年还会继续发展下去,更多的项目可能会失败,然后人们会意识到需要有正确的文化,只有这样他们才能获得成功。”
 
Tech Pro:最后,你认为,随着自助服务工具的​​出现,以及非专业人士和“公民数据科学家” 越来越多地参与,大数据的发展会不会有一个民主化的进程?
 
Nijhawan:“我认为这种情况确实会发生:这是投资大数据得以持续和实现价值的唯一途径——别无选择。无论是IT部门还是供应商,都有足够多的人来推动这个问题,并找到解决问题的方法。在三到五年的时间里,人们不会过多地关注大数据,而是将以自助服务的方式关注大数据的结果。”

关键字:大数据

原创文章 企业网D1Net

x 文化、自动化和自助服务:大数据成功的关键 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

文化、自动化和自助服务:大数据成功的关键

责任编辑:cres 作者:Charles McLellan 译者:HERO |来源:企业网D1Net  2017-10-18 11:39:09 原创文章 企业网D1Net

Infogix公司总裁兼首席执行官Sumit Nijhawan介绍了许多大数据项目失败的原因,以及企业如何充分利用这一领域的投资。
 
最近,调研机构Tech Pro Research公司与数据完整性和数据治理解决方案厂商Infogix公司首席执行官兼总裁Sumit Nijhawan对大数据的状态和发展进行了交流与探讨。该公司创建于30年前,原名为Unitech Systems。在大数据时代开始之后,2005年公司更名为Infogix。该公司最近的企业并购是2017年2月收购了Data3Sixty公司,这是一家专注于云计算数据治理的行业领先的提供商。
 
早在2016年11月,Infogix公司就发布了2017年十大变革性数据趋势,并于今年8月又一次进行了更新。人们对Infogix公司针对今后趋势发展的再次预测十分关注。为此,调研机构Tech Pro Research公司对Infogix公司总裁兼首席执行官Sumit Nijhawan进行了采访。
 
Tech Pro:Infogix公司最近更新了2017年的大数据预测,这是因为有了意想不到的发展还是其他原因?
 
Nijhawan:“在今年前六个月,我们在与客户合作中制定了我们的市场战略和产品策略,而根据我们和客户对市场的观察,对于发展趋势的更新是有意义的,特别是在大数据治理领域。
 
我们对几乎所有的客户都有一个大数据倡议,许多项目都开始进行了更多的投资和动作,但是他们发现所取得的进展和从投资中获得的价值,往往不符合最初的期望。
 
我们在就一些事情正在与客户合作,我们认为可以变革的是数据治理,数据准备,自助服务和较小的数据湖部署的组合。”
 
Tech Pro:你所说的从大数据中获得洞察力的主要瓶颈实际上是如何发现所拥有的具有价值的数据,并将其用于分析吗?
 
Nijhawan:“是的,大部分的重点是提供存储环境——Hadoop,并让每个人都可以将任何数据转储到其中。在这里要考虑两件事情:一,他们到底向Hadoop导入的目标和项目到底是什么?第二,即使数据存在,它不受管理,是不可搜索的,是不能发现的,它不是以某种方式吸引消费者的数据,并帮助他们获取价值,并非常依赖IT部门 ,仍然需要技术人员来处理,而这不是客户从这些投资中获得价值的方法。”
 
Tech Pro:你所提到的Hadoop仍然是大数据领域的关键产品吗?
 
Nijhawan:“大数据不仅仅是关于Hadoop的,而且我也认为Hadoop将一直是保持大数据业务的组成部分,因为有足够的投入。而且实际上,它作为一种技术满足了人们的需求,但是它也有一个整体生态系统:例如Spark,还有Cassandra,MongoDB和HBase这些数据库,以及所有Hadoop提供的存储和框架,这就是这些技术的发展情况。”
 
Tech Pro:说,大多数公司仍然努力从大数据技术投资中获取商业价值吗?
 
Nijhawan:“是的,没错,因为这一切都是作为一个实验开始的,而且有些实验效果很不错。但是如何将这些实验转化成真正能够以可持续的方式提供企业洞察力的东西?这就是每个人的努力方向。
 
这就像是在说:‘我拥有一大堆产品,我将存放产品的仓库设置在了一个偏远的地方,现在告诉我你想要什么,我会把产品发送给你。’但人们不知道这个仓库里面有什么,或者怎么做,因此需要电子商务,例如亚马逊风格的网站,亚马逊有很多仓库,但它之所以能起作用,是因为他们把电子商务模式整合在一起:任何人都可以访问,找到他们想要的东西,将其放到购物车上,为其分配价值——亚马逊甚至向消费者推荐他们应该尝试的东西,在这个背后有一个供应链在发挥作用,将产品运送给消费者。
 
大数据需要什么?缺少了什么?缺少的是亚马逊这样的顶级网站,以及其背后的供应链的自动化。”
 
Tech Pro:那么,许多组织的业务和IT之间的关系是否存在着一种脱节呢?组织需要培养一种“数据文化”吗?在这种情况下,业务部门知道如何询问数据的正确问题,并产生自己的见解吗?
 
Nijhawan:“我们当然需要更多的业务驱动的数据文化。这并不是IT人员不愿分享,只是他们拥有这些工具,他们认为自己做得很好,但他们并不真正知道其最终的目标是什么,这就是为什么脱节的原因。除非它是一个商业驱动的举措,否则它很难实现任何有意义的事情。”
 
Tech Pro:许多组织是否缺少可以连接企业管理层与业务部门以及IT部门的首席数据官(CDO)这个环节?
 
Nijhawan:“这个环节很可能是缺失的,但我不会说这只是一个职位的问题。刚才提到的‘数据文化’是关于人、过程和技术以及数据本身的。它实际上是关于端到端的过程:例如如何处理数据的方法,所要处理的数据,以及交付数据的方式。这个端到端的过程需要由业务发起人发起,这当然可以是首席数据官(CDO)来实施。但如今首席数据官面临的问题是,在许多组织中,这几乎是一个尴尬的职位:如果首席数据官(CDO)具有一定影响力,最终将成为向供应商去推销他们技术和产品的人,而不是没有成为实现业务目标的人。
 
如今的许多首席数据官都是来自IT部门,但企业真的需要一个有商业背景的人。”
 
Tech Pro:当与客户沟通时,你认为目前最需要哪些数据相关技能?一些分析人士发现企业对数据科学家的需求有所下降,这是真的吗?
 
Nijhawan:“我认为这种需求正在减少,但这并不是因为数据科学家过剩。更重要的是,现在的数据科学家无法提供企业想要的价值。于是问题就变成了:‘如果我没有得到价值,那么招募更多的数据科学家又有什么意义呢?’‘为什么我不能让公司的业务人员和日常数据分析师来承担这项工作?’坦白地说,这些人就可以胜任,由于80%的数据科学家能够解决的问题可以通过20%的机器算法来解决,而且这些算法能够采用易于使用的方式,数据分析师和业务分析师可以将其纳入运营和业务流程,其结果导致企业对数据科学家的需求下降。”
 
Tech Pro:人们听到很多关于“自助服务”的分析,而不再需要更多的专家参与,你认为其发展方向是什么?
 
Nijhawan:“按照这些原则,我们正在与客户进行的工作是查看他们已经拥有数据湖计划 - Hadoop,Cloudera和所有这些数据的大数据,并给出建议,‘也许你不需要这些开源技术,不必花费数月时间和数百万美元的费用,我们将为你提供端到端的设备,实现完全自助的大数据服务,这一切都是集成的。你所需要做的只是消费数据,让你们的业务人员和数据科学家的工作压力得以缓解。’而这在市场上有很大的吸引力。”
 
Tech Pro:如今,几乎每个人都在谈论机器学习和人工智能,你认为这些技术将在大数据方面发挥什么作用?
 
Nijhawan:“机器学习和人工智能的应用和发展已经存在一段时间了,但是现在还有很多争论,但是就像我之前说的那样:80%的问题可以通过20%的机器学习算法来解决,如分割,推荐,分类,回归,以及预测。大数据质量是具有更大吸引力的一个领域,传统上数据质量一直在确定匹配规则和重复规则,以及所有这些内容,现在数据量十分庞大,人们在数据湖中投入更多的数据,他们不一定知道确切的规则是什么,而只是使用机器学习算法,例如分段和分类来查找异常值,这就是机器学习已经带来了很多价值的原因,但是同样,企业并不需要经验和知识非常丰富的数据科学家来做到这一点。”
 
Tech Pro:2017年的十大趋势之一是“信息学的转型和识别数据价值的能力”。你如何定义“信息学”和“数据科学/工程”之间的差异?
 
Nijhawan:“这里的主要区别是,企业必须按照传统的定义,将数据的货币化和数据的价值添加到信息学中,一旦加入,我认为这是真正的信息学,而且每个人都在谈论数据的价值时,他们非常主观地进行谈论,我们所做的一些研究,实际上把数据看作是资产负债表的组成部分,在这一方面,数据既是一种资产,也可以是一种负债。因此,从企业所拥有的并赋予其价值不同的数据集的角度来看:是什么使它成为一种资产,又是什么使它成为一种负债,并为其带来价值。这是我们的一个研究领域。”
 
Tech Pro:你如何看待广泛应用的物联网设备将更多的数据输入到公司的系统中,这将如何改变大数据市场?
 
Nijhawan:“物联网设备现在是大数据投资的主要驱动力,我认为这项技术已经可以解释这些数据,尽管人们确实需要更多的商业头脑来理解它,并理解其中的含义。这就是发生的进化:数据能告诉人们什么是其不知道的,而不是要求某人知道应该发生什么,或者可能发生什么事。自动发现结论和解释是我认为需要做更多工作的地方。”
 
Tech Pro:你认为大数据技术的发展将会在2017年减缓吗?今年是一个分水岭吗?
 
Nijhawan:“不,我认为2017年还会继续发展下去,更多的项目可能会失败,然后人们会意识到需要有正确的文化,只有这样他们才能获得成功。”
 
Tech Pro:最后,你认为,随着自助服务工具的​​出现,以及非专业人士和“公民数据科学家” 越来越多地参与,大数据的发展会不会有一个民主化的进程?
 
Nijhawan:“我认为这种情况确实会发生:这是投资大数据得以持续和实现价值的唯一途径——别无选择。无论是IT部门还是供应商,都有足够多的人来推动这个问题,并找到解决问题的方法。在三到五年的时间里,人们不会过多地关注大数据,而是将以自助服务的方式关注大数据的结果。”

关键字:大数据

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^