如何将机器学习模型投入生产获得竞争优势

责任编辑:cres

作者:HERO编译

2019-10-23 08:33:09

来源:企业网D1Net

原创

对于一些企业来说,采用机器学习技术是一场竞赛。首先,那些能够大规模将机器学习模型投入生产的企业,将获得超过竞争对手的巨大优势,并获得大量收入。

很多首席技术官都强调机器学习是一种颠覆其行业并带来创新的技术。但是,他们如何有效地将机器学习模型投入生产以获得竞争优势?
 
企业如何才能更快地将机器学习模型投入生产
 
对于一些企业来说,采用机器学习技术是一场竞赛。首先,那些能够大规模将机器学习模型投入生产的企业,将获得超过竞争对手的巨大优势,并获得大量收入。但是,机器学习的可用性存在一个巨大的问题,那就是将机器学习模型大规模投入生产面临巨大的挑战。
 
组织可以创建极其复杂的机器学习模型,但是要获取庞大的数据集,将其应用于机器学习模型的不同迭代,然后将这些成功的迭代部署到生产中将面临一些问题。
 
机器学习领域发挥作用的地方
 
机器学习平台Valohai公司首席执行官Eero Laaksonen解释说,“由于数据杂乱无章,很少有人能够了解这些数据的相关性。”
 
这就是机器学习和深度学习发挥重要作用的地方;它充当起点和终点之间的桥梁。机器学习构建功能,其结果就是模型。Laaksonen继续说道,“这与软件开发不同,因为开发人员只是编写功能。使用机器学习,它将代码与数据结合起来以定义模型。”
 
如今,使用机器学习的工作方法与20世纪90年代软件开发时的情况非常相似——开发人员面临着更大的压力,需要更快地将成功的机器学习算法部署到生产中。
 
为什么很难将机器学习模型投入生产?
 
机器学习模型难以投入生产的原因有很多:
 
1.实验的可重复性:代码和数据的组合很难复制。
 
2.合规性:Laaksonen说:“机器学习不能无序发展,组织和监管机构需要找出有关决策的法律,从人类的角度来看,这是更可靠的方法。欧洲一直在通过GDPR法规对此采取积极行动,这是一个正确方向,但很难将法规纳入机器学习生产中。例如金融机构必须能够解释他们六个月做出的自动决策,而这是数据和模型的输出。如果机器学习模型正在生产中运行,则目前尚无法确定是什么原因导致它做出该决定,而这需要改变。组织需要可追溯性,因此,机器学习中的版本控制非常重要。”
 
3. 快速加入团队:组织希望提高开发人员和机器学习团队的水平,对于组织管理人员来说,很难参与到其开发项目中去了解开发人员和机器学习团队在做什么,并确定数据在哪里。Laaksonen继续说,“此外,还有雇用科学家的问题。组织需要能够跟踪他们在做什么,他们开发的项目和管道等。”
 
4.快速实验:速度是关键,但是对于机器学习来说,这是一种反复试验的方法。尝试使用机器学习进行更多操作的唯一方法是在其上面安装更多硬件,这非常具有挑战性——每一个更改都必须用大量的数据进行测试。
 
加快机器学习模型的生产
 
Valohai平台作为一种机器学习平台即服务解决了这些问题,它阐明了深度学习和机器学习。该平台将保存已用于运行不同机器学习模型的数据集,并显示了负责人、实验成本以及使用的数据类型等指标。该平台通过将数据管道生成新的模型,可以有效地快速跟踪机器学习所需的试错模型。
 
Laaksonen解释说,“开发人员在云端运行时,无法监控机器学习的处理能力。使用我们的平台,可以保存输出,并在数据存储上查看结果。组织可以在来自不同来源的已保存数据集中测试不同的机器学习模型。”其目的是更快地从原始数据迁移到生产环境,该平台使组织能够重新运行数据管道,重新训练模型并进行部署。
 
用例
 
Laaksonen表示还有很多用例。他提到了Valohai平台的客户之一TwoHat Security公司,该公司正在建立一种模型来阻止网站散布不良内容。TwoHat Security公司正在与加拿大的执法部门和大学合作,建立一种机器视觉模型,以检测来自Valohai平台上的暗网和一些网站发布的不良内容。
 
还有一些应用程序用于预测性维护,例如预测金融服务风险,以及电信公司采用应用程序预测未来通信塔台部署的位置。
 
版权声明:本文为企业网D1Net编译,转载需注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号