摘要:
如今,美国国家数据科学协会指导委员会成为了一个积极的和不断发展的组织。美国国家数据科学协会指导委员会主席斯坦·阿豪特将讨论大数据将如何发展,为什么会以应运而生。斯坦·阿豪特博士是RENCI计算研究所所长,北卡罗莱纳大学教堂山分校的计算机科学教授,还是美国数据科学协会指导委员会(NCDS)主席。
斯坦·阿豪特博士
大数据是一个热门话题,从科学杂志到大众媒体,终于不再描述什么是“大”。,而大数据面临的挑战和机遇问题越来越多,通过大数据进行数据排序就是人们面临的挑战之一。
讨论问题是一个很好的开始,但采取行动则更好。2013年,主要就职于北卡罗莱纳州的三角研究园区的少数几位学术研究人员和业务的专业人才牵头,共同开发所使用的大数据对于科学,商业和教育最大的作用和影响,以及实际项目的策略。如今称之为美国全国联合会数据科学,或NCDS。
早在2012年,斯坦·阿豪特是NCDS的一个主要支持者,他曾经花费大量时间与那些在工作中创造数据的人进行沟通,这些工作人员使用数据来开发产品,进行研究,并了解他们的客户;还有那些建立收集、共享、分析和管理数据的技术专家。阿豪特的信息很简单:要数据丰富的世界中,大多数将需要特定领域的研究项目和孤立的产品开发工作。而企业和政府的世界必须被推翻那些科学领域和孤立的研究之间的阻碍。利用海量数据,并从数据收集真实的知识必须具有广泛基础和战略的努力,并必须解决一切问题。这些都来自数据专家的想法,要将数据研究快速转化为突破性的产品和服务。
对于许多人来说,这一信息是真实的,他们从不同的角度看数据的挑战。因此,如今的NCDS成为了一个积极的和不断增长的组织,其成员包括美国研究型大学(包括北卡罗来那大学校园、卓克索大学、德克萨斯A&M,UNC总署),大型企业(Cisco,德勤、EMC、GE、IBM公司),以及政府机构和非营利组织(RTI国际,MCNC,以及美国环境保护局)。
人们的成功很可能与不耐烦有关。人们没有为利用大数据的所有问题的答案,但我们知道行动是必要的,或者数据的破坏力一直困扰着人们。因此由北卡罗莱纳州教堂山分校一个专业团队的计算研究所(RENCI)选择了行动。在第一年中边学边做。并不是所有的事情都像人们所预料的那样被证明,但却成功地建立了一个由不同成员组成的组织,有着不同的议程。我们也开始了解如何定义可以对重要数据的挑战影响最大。经过专家、学生、数据的劳动力,以及数据的研究人员艰苦的努力,以及在计划和活动的发展,人们学到以下几点:
·寻找解决数据共享,分析,管理和长期策展的挑战,需要认识到数据科学等同于任何其他领域的科学。NCDS定义了数据科学的流程、管理系统的研究和分析,使数字数据和数据驱动的经济得以研究、发现,以及决策。
·而数据科学家的感觉是敏锐的,谷歌公司首席经济学家哈尔·瓦里安早在2009年表示:对于数据的能力,要能理解它,处理它,从中提取价值,对其进行可视化和进行沟通,这将是一个在未来的几十年的非常重要的技能。
麦肯锡全球研究所估计,到2018年,仅美国就可能面临14万 19万人深度分析能力不足的问题。但是,尽管如今数据科学和分析高级学位课程泛滥,但数据的科学课程还没有一个标准,另外这些方案是否能满足在商业世界中的数据专家的需求,目前还不清楚。这就是为什么NCDS赞助商需要挖掘那些在分析、信息科学、数据驱动的科学领域中有才华的学生的主要原因。这也是为什么组成的教师和企业新成员发展数据科学课程计划团队的原因,以及为什么正在努力建立一个数据观测站点,为学生提供面对和处理非常大的数据集的机会与现实。
数据的挑战无处不在,并且是普遍的,这意味着解决方案必须打破科学领域之间以及公共和私营部门之间的壁垒。企业资助大学的研究人员研究其感兴趣的调查数据科学问题,这是比较简单的。而更难的是,将大学的研究人员、软件和硬件专家,以及专业人士在多个业务部门并肩努力工作的成果,即把数据转换成知识和产品,获得一个更好的生活质量。这种工作需要弥合文化上的障碍,找到共同点,学习新词汇,要相互适应,有时候还需要妥协。
在NCD的工作组中,其中包括来自工业界,学术界和非营利部门的成员。他们的数据伙伴有具有长期职业生涯的研究员,还有解决有趣的数据科学问题的教师,而这些人希望将他们的工作成盯转化为商品。这种合作还比较少见,但必须找到大数据解决方案,这可以创建个性化的医疗保健服务,了解产品开发,并基于最新数据进行实时决策。
对于NCDS来说,近两年来一直在忙,有时结果令人沮丧,但有时也很有趣,而且往往令人振奋。他们并不要求对于艰巨的数据管理问题获得所有的答案,也没有想出如何确保全球具有数据素养的员工队伍的方法,而这需要在未来解决。
但是,他们已经了解到,数据解决方案必须由来自不同背景的一起工作的人共同面对。他们相信已经创造了关键面向行动的一个合作框架。