当前位置:CIO技术探讨 → 正文

克服预测分析挑战的7个技巧

责任编辑:cres 作者:John Edwards |来源:企业网D1Net  2018-07-23 11:10:45 原创文章 企业网D1Net

虽然预测分析是一个强大的工具,但它无法预见的是用户在部署和使用该技术本身时所遇到的问题。为此,这里提供了一些此类问题的帮助手册。
 
将统计技术和预测分析应用于业务流程的先驱W. Edwards Deming有一句名言。“最大的问题,”他说,“就是人们一开始没有意识到自己有一个问题。”
 
在预测分析方面,所谓的“大问题”往往在规划和早期部署过程中并不明显,只有在技术无法随着时间推移而按期交付时才会引起关注。
 
边缘设备分析软件开发商SWIM.AI的首席技术官Simon Crosby承认,许多常见的预测分析挑战都是由于糟糕的计划和不切实际的期望而产生的。“预测分析不是一根魔棒,不是只要你挥舞它就可以自动地改进系统或组织中的问题,”他解释道。“你需要好好了解你所追求的洞察力,并选择一个工具集,让你可以快速形成假设,动态地将分析注入数据流,以搜寻数据的相关性或异常,或者预测其未来的表现。”
 
以下是成功的预测分析采纳者用来避免或解决常见项目挑战的七个技巧。
 
1.创建并执行一个正式的策略
 
像魔棒那样“挥舞它”绝对不是最佳的预测分析方法,因为它可以说是目前在日常使用中的最先进、最复杂的企业技术。风险管理咨询公司CBIZ Risk and Advisory Services的高级经理Scott Moody建议说:“建立预测分析策略的第一步是确定想要完成的目标。”例如,部署是旨在增加销售么?它会发现欺诈还是能够识别风险?他说:“在制定战略时要牢记‘目标’,这将有助于让你集中精力于战略的具体目标。”
 
Climax Strategy Group的负责人karrie Sullivan建议进行初步的库存清点,汇集来自各个业务部门的相关数据,以确定组织进行预测分析的初始概况。她说:“要注意库存数量、历史记录、数据格式,以及相邻系统/过程之间的重叠。”
 
最后,在关键业务领域部署预测分析之前,必须运行一些非正式的测试,以了解如何使用该技术预测现实世界的业务情况。可以优先在市场营销或客户服务等数据比较丰富的领域进行实验。“这一步的目标就是让每个人都能在预测分析的作用上达成一致,”Sullivan解释道。
 
2.确保数据质量
 
富有洞察力的预测分析需要可靠的数据。不准确的数据实际上必将带来错误或误导性的结果。“确保数据质量的第一步是在有效的自动输入控制机制下将数据输入系统,”Moody说。
 
每当数据质量超出组织的控制范围时,例如从外部提供商处获取数据时,审查数据质量应该是分析过程的第一步。 他警告说:“在验证和纠正数据质量问题之前,必须进行深入分析,因为如果在后期才发现质量问题,可能会导致大量返工。”
 
不过,Crosby认为,如今的企业不必像过去那样对数据质量过分挑剔。他说:“当下先进的技术已不再要求数据的完美无瑕或完全可理解了。”我们可以利用学习来自动推断‘灰色数据'的模式。Crosby指出,真正重要的是能够获得尽可能多的原始数据。“所以,你只需要检测你的系统并收集大量的数据,”他说。
 
3.管理数据
 
虽然能够访问大量数据池通常是一件好事,但向预测分析工具提供大量多余的数据可能会减慢基本流程的速度,同时冒着将机密数据暴露给窥探者的风险。“有太多的数据反而会让你无法知道什么是可以用来分析的正确数据,”Moody解释说。“保持良好的数据清单将有助于确保在执行预测分析时使用正确的数据。”
 
Sullivan认为,高效管理数据的技巧在于准确的理解哪些数据集可能有用,哪些数据集可以安全地被忽视。一个熟练的数据科学家最有资格做出这样的决定。(数据科学家)有时会发现……她指出,大多数人会把有用的数据当作“噪音”而丢弃。
 
4.尊重数据的隐私权和所有权
 
面对越来越多的公众和政府审查,企业现在需要比几个月前更认真地对待保护数据隐私和所有权的挑战。预测分析采用者也不例外。限制文件访问并只使用分析所需的数据是推荐的做法。“掩蔽个人识别字段是保护数据隐私的有效方式,”Moody说。“还有许多工具可以去除可识别数据,减少对数据隐私的担忧。”
 
避免隐私侵犯的最简单的方法是只保留必要的最小时间段内的数据。“通过快速抛弃不必要的数据,动态获得高价值的数据洞察,可以有效的避免原始数据的隐私问题,”Crosby解释道。
 
5.效用最大化
 
当从一开始就设计合适的复杂模型以产生易于理解的结果时,可能使预测分析技术的效果最好。但事实并非如此。实际上,组织经常发现自己迷失在如此复杂和难以理解的结果中,只有数据科学家才能准确地解释它们。另一个极端是,结果过于简略和简单化,以至于它们对利益相关者几乎毫无价值。
 
为了获得尽可能高的可用性,构建和部署考虑到最终用户的用户界面非常重要。“虽然基础模型可能很复杂,但一个好的用户界面可以让结果变得非常简单,”医学预测分析和机器学习公司LeanTaaS的创始人兼首席执行官Mohan Giridharadas说。看看Google的web搜索或苹果的iPad,可以从中获得灵感。“这些产品的用户体验几乎对所有人都是友好的,但其中隐藏了这些公司内置的难以置信的软件和硬件复杂度,”Giridharadas评论道。
 
Adobe Analytics Cloud的产品经理Ben Gaines指出,预测分析是一门迭代科学。一旦模型启动,这一事实就变得显而易见了。“你最终将看到这个模型做得有多好,你可以调整和重新校准它以获得更准确和可操作的见解,”Gaines解释道。例如,预测模型可以帮助组织预测趋势,如设备间的预期流量,使用户能够预测每页的展示次数,或者根据预计的收入设置预算和目标。“一旦你获取了真实的数据,并定下预算和目标,你就可以以此调整你的模型,”他建议道。“重要的是要了解你的预测分析程序不一定会完美地运行,错误是不可避免的,但它将帮助你更好地理解数据和模型。”
 
6.控制成本
 
在线贷款公司Marlette Funding的首席决策科学官Arnold Pravinata指出,在大多数分析预算中,数据获取和工资支出是两个最大的项目。为了帮助控制数据成本,Pravinata建议定期检查是否有资金被浪费在无用的或低效的数据上。“就人力资源成本而言,这是我们通常需要跟随市场趋势的地方,”他说。
 
随着数据量的增加,存储成本也可能迅速上升。Sullivan认为,控制成本的最佳总体方法是集中数据并应用可靠的治理策略。“我相信在未来的几年里,我们会更广泛地讨论如何实现预测分析的维护自动化,但是现在我们仍然将受困于此,”她说。
 
7.选择合适的工具
 
预测分析市场正在迅速扩张,这意味着新的采用者将面对一系列的令人眼花缭乱的平台和工具。很少有企业拥有能够在这些领域做出明智选择的内部人才。在内部建立这样的技能需要时间和金钱投入。因此,大多数组织在开发预测分析计划时都会寻求某种形式的外部帮助。在这样做的同时,密切关注被推荐的产品和服务,并考虑如何将它们融入组织的长期计划是很重要的。“优先选择那些不会将您与特定分析算法或学习堆栈绑定在一起的解决方案,”Crosby建议道。“由于所有的这些都是开源的,所以这样的流式分析平台能够随着时间的推移动态升级到更先进的算法上来。”

关键字:CIO预测分析

原创文章 企业网D1Net

x 克服预测分析挑战的7个技巧 扫一扫
分享本文到朋友圈
当前位置:CIO技术探讨 → 正文

克服预测分析挑战的7个技巧

责任编辑:cres 作者:John Edwards |来源:企业网D1Net  2018-07-23 11:10:45 原创文章 企业网D1Net

虽然预测分析是一个强大的工具,但它无法预见的是用户在部署和使用该技术本身时所遇到的问题。为此,这里提供了一些此类问题的帮助手册。
 
将统计技术和预测分析应用于业务流程的先驱W. Edwards Deming有一句名言。“最大的问题,”他说,“就是人们一开始没有意识到自己有一个问题。”
 
在预测分析方面,所谓的“大问题”往往在规划和早期部署过程中并不明显,只有在技术无法随着时间推移而按期交付时才会引起关注。
 
边缘设备分析软件开发商SWIM.AI的首席技术官Simon Crosby承认,许多常见的预测分析挑战都是由于糟糕的计划和不切实际的期望而产生的。“预测分析不是一根魔棒,不是只要你挥舞它就可以自动地改进系统或组织中的问题,”他解释道。“你需要好好了解你所追求的洞察力,并选择一个工具集,让你可以快速形成假设,动态地将分析注入数据流,以搜寻数据的相关性或异常,或者预测其未来的表现。”
 
以下是成功的预测分析采纳者用来避免或解决常见项目挑战的七个技巧。
 
1.创建并执行一个正式的策略
 
像魔棒那样“挥舞它”绝对不是最佳的预测分析方法,因为它可以说是目前在日常使用中的最先进、最复杂的企业技术。风险管理咨询公司CBIZ Risk and Advisory Services的高级经理Scott Moody建议说:“建立预测分析策略的第一步是确定想要完成的目标。”例如,部署是旨在增加销售么?它会发现欺诈还是能够识别风险?他说:“在制定战略时要牢记‘目标’,这将有助于让你集中精力于战略的具体目标。”
 
Climax Strategy Group的负责人karrie Sullivan建议进行初步的库存清点,汇集来自各个业务部门的相关数据,以确定组织进行预测分析的初始概况。她说:“要注意库存数量、历史记录、数据格式,以及相邻系统/过程之间的重叠。”
 
最后,在关键业务领域部署预测分析之前,必须运行一些非正式的测试,以了解如何使用该技术预测现实世界的业务情况。可以优先在市场营销或客户服务等数据比较丰富的领域进行实验。“这一步的目标就是让每个人都能在预测分析的作用上达成一致,”Sullivan解释道。
 
2.确保数据质量
 
富有洞察力的预测分析需要可靠的数据。不准确的数据实际上必将带来错误或误导性的结果。“确保数据质量的第一步是在有效的自动输入控制机制下将数据输入系统,”Moody说。
 
每当数据质量超出组织的控制范围时,例如从外部提供商处获取数据时,审查数据质量应该是分析过程的第一步。 他警告说:“在验证和纠正数据质量问题之前,必须进行深入分析,因为如果在后期才发现质量问题,可能会导致大量返工。”
 
不过,Crosby认为,如今的企业不必像过去那样对数据质量过分挑剔。他说:“当下先进的技术已不再要求数据的完美无瑕或完全可理解了。”我们可以利用学习来自动推断‘灰色数据'的模式。Crosby指出,真正重要的是能够获得尽可能多的原始数据。“所以,你只需要检测你的系统并收集大量的数据,”他说。
 
3.管理数据
 
虽然能够访问大量数据池通常是一件好事,但向预测分析工具提供大量多余的数据可能会减慢基本流程的速度,同时冒着将机密数据暴露给窥探者的风险。“有太多的数据反而会让你无法知道什么是可以用来分析的正确数据,”Moody解释说。“保持良好的数据清单将有助于确保在执行预测分析时使用正确的数据。”
 
Sullivan认为,高效管理数据的技巧在于准确的理解哪些数据集可能有用,哪些数据集可以安全地被忽视。一个熟练的数据科学家最有资格做出这样的决定。(数据科学家)有时会发现……她指出,大多数人会把有用的数据当作“噪音”而丢弃。
 
4.尊重数据的隐私权和所有权
 
面对越来越多的公众和政府审查,企业现在需要比几个月前更认真地对待保护数据隐私和所有权的挑战。预测分析采用者也不例外。限制文件访问并只使用分析所需的数据是推荐的做法。“掩蔽个人识别字段是保护数据隐私的有效方式,”Moody说。“还有许多工具可以去除可识别数据,减少对数据隐私的担忧。”
 
避免隐私侵犯的最简单的方法是只保留必要的最小时间段内的数据。“通过快速抛弃不必要的数据,动态获得高价值的数据洞察,可以有效的避免原始数据的隐私问题,”Crosby解释道。
 
5.效用最大化
 
当从一开始就设计合适的复杂模型以产生易于理解的结果时,可能使预测分析技术的效果最好。但事实并非如此。实际上,组织经常发现自己迷失在如此复杂和难以理解的结果中,只有数据科学家才能准确地解释它们。另一个极端是,结果过于简略和简单化,以至于它们对利益相关者几乎毫无价值。
 
为了获得尽可能高的可用性,构建和部署考虑到最终用户的用户界面非常重要。“虽然基础模型可能很复杂,但一个好的用户界面可以让结果变得非常简单,”医学预测分析和机器学习公司LeanTaaS的创始人兼首席执行官Mohan Giridharadas说。看看Google的web搜索或苹果的iPad,可以从中获得灵感。“这些产品的用户体验几乎对所有人都是友好的,但其中隐藏了这些公司内置的难以置信的软件和硬件复杂度,”Giridharadas评论道。
 
Adobe Analytics Cloud的产品经理Ben Gaines指出,预测分析是一门迭代科学。一旦模型启动,这一事实就变得显而易见了。“你最终将看到这个模型做得有多好,你可以调整和重新校准它以获得更准确和可操作的见解,”Gaines解释道。例如,预测模型可以帮助组织预测趋势,如设备间的预期流量,使用户能够预测每页的展示次数,或者根据预计的收入设置预算和目标。“一旦你获取了真实的数据,并定下预算和目标,你就可以以此调整你的模型,”他建议道。“重要的是要了解你的预测分析程序不一定会完美地运行,错误是不可避免的,但它将帮助你更好地理解数据和模型。”
 
6.控制成本
 
在线贷款公司Marlette Funding的首席决策科学官Arnold Pravinata指出,在大多数分析预算中,数据获取和工资支出是两个最大的项目。为了帮助控制数据成本,Pravinata建议定期检查是否有资金被浪费在无用的或低效的数据上。“就人力资源成本而言,这是我们通常需要跟随市场趋势的地方,”他说。
 
随着数据量的增加,存储成本也可能迅速上升。Sullivan认为,控制成本的最佳总体方法是集中数据并应用可靠的治理策略。“我相信在未来的几年里,我们会更广泛地讨论如何实现预测分析的维护自动化,但是现在我们仍然将受困于此,”她说。
 
7.选择合适的工具
 
预测分析市场正在迅速扩张,这意味着新的采用者将面对一系列的令人眼花缭乱的平台和工具。很少有企业拥有能够在这些领域做出明智选择的内部人才。在内部建立这样的技能需要时间和金钱投入。因此,大多数组织在开发预测分析计划时都会寻求某种形式的外部帮助。在这样做的同时,密切关注被推荐的产品和服务,并考虑如何将它们融入组织的长期计划是很重要的。“优先选择那些不会将您与特定分析算法或学习堆栈绑定在一起的解决方案,”Crosby建议道。“由于所有的这些都是开源的,所以这样的流式分析平台能够随着时间的推移动态升级到更先进的算法上来。”

关键字:CIO预测分析

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^