当前位置:云计算行业动态 → 正文

优化公共云基础设施以实现最佳性能

责任编辑:cres 作者:HERO编译 |来源:企业网D1Net  2018-08-15 10:29:20 原创文章 企业网D1Net

根据调研机构Gartner公司的调查,全球公共云服务市场预计2018年将增长约21%,市场规模超过1860亿美元,高于2017年的1535亿美元。该研究和咨询公司还预测到2021年,将近三分之一IT支出将用于基于云计算的基础设施、中间件、应用程序和业务流程服务。
 
而根据RightScale公司最新的云状况调查报告表明,越来越多的企业越来越多地将公共云视为其IT战略的重中之重,在2018年,38%的受访者这么认为,而去年为29%。许多行业巨头(例如花旗集团、联邦快递、GAP、通用电气、Intuit、Kaiser Permanente等公司)现在依靠公共云服务来实现其数字化转型。
 
毫无疑问,公共云帮助企业将资本支出转到运营支出,使新项目的基础设施保持更低的成本,并提供规模经济,以及几乎无限的弹性。基础设施即服务(IaaS)是公共云中最大的增长领域之一,而客户关系管理(CRM)和企业资源规划(ERP)等软件即服务(SaaS)应用程序仍继续在整个企业环境中获得牵引力,这主要是因为它们具有灵活性。
 
尽管行业领先的企业致力于提供云计算服务作为其业务的核心部分,但云计算环境中的工作负载仍然非常复杂。此外,借助IaaS或平台即服务(PaaS)云平台,云计算服务提供商(CSP)可能无法访问应用程序性能数据。此外,许多重要的云计算工作负载对其延迟至关重要,因此需要严格的服务质量(QoS)级别以满足用户期望。仅仅几百毫秒的边际服务质量(QoS)延迟会极大地影响用户体验。例如,网络搜索必须在几分之一秒内完成,否则用户可能会放弃浏览和搜索。电子商务网站的延迟通常意味着客户将其业务转移到其他地方。
 
企业的云平台是否按计划运行?
 
云计算面临的一个重要问题是调度,这会影响系统性能。调度主要是提高资源的有效利用率,从而减少任务完成时间。需要尽快安排延迟关键工作负载,以避免任何排队延迟。另一方面,当有空闲资源来提高资源利用率时,应该允许Hadoop MapReduce等尽力而为的工作占用。其挑战在于如何在最大化集群利用率的同时最小化短作业的排队延迟。
 
云计算面临的一个重要问题是调度,这会影响系统性能。某些调度方法只是静态分配资源,但在初始分配后并不调整资源。这些方法无法为管理云计算工作负载的动态特性提供有效的解决方案。大多数云计算服务商需要了解其工作负载属性,以有效地预测服务质量(QoS)并优化指定的指标。
 
优秀的云计算服务商具有良好的调度,但关键算法是基于凭证的,可能是特定于工作负载的。大多数云计算服务商缺乏对其工作负载的有效调度,导致资源利用效率低下以及任务完成的拖延。
 
对于云计算服务商来说,好消息是有一个资源管理解决方案可以提供有效的调度程序算法,并可以为不同的工作负载分配适当的硬件资源,例如CPU内核和缓存大小。然后,延迟关键工作负载可以满足其服务级别协议(SLA)要求,并且可以充分利用整个硬件资源。
 
资源管理解决方案可以提供重要的应用程序利用率数据,例如每个应用程序缓存占用率和每个应用程序内存带宽数据。通过整合平台性能监视单元(PMU)提供的计数器(例如每指令周期数和每条指令的低级缓存的未命中数),资源管理解决方案可以访问有价值的信息以增强应用程序性能监视。同样,其目标是帮助云计算服务商更有效地管理其资源。
 
基于历史应用程序利用率数据和指标,资源管理解决方案使用高级机器学习控制循环来实现尽力而为工作负载托管,而不会影响对延迟敏感的应用程序。另一种用法是通过利用资源控制器技术解决方案和其他性能指标,资源管理解决方案使用机器学习算法有效地检测来自不同争用资源的性能影响,例如缓存争用、TDP争用和内存带宽争用。此信息对于云计算服务商现有的调度也非常有用,因此可以提高其效率。
 
这一切在理论上可行,但都需要在实践中验证成功,或者在云平台成功运行应用程序。在最近的一项实验中,IT人员运行了延迟关键的工作负载,例如Apache Cassandra,并部署了机器学习控制循环算法。Cassandra是一个开源的分布式NoSQL数据库系统,可在商用硬件或云计算基础设施上运行关键任务数据。Constant Contact、eBay、GoDaddy、Hulu,、Instagram、Netflix和The Weather Channel都使用Cassandra来处理大型活动数据集。
 
如果在工作负载方面实施静态添加,则延迟关键工作负载会受到严重影响,无法满足其服务协议水平(SLA)。借助机器学习控制循环算法来协助运行工作负载,Cassandra表现非常出色,而且使用静态调度程序实现了类似的作业性能输出。
 
在不久的将来,公共云服务将越来越多地用于支持从人工智能(AI)和机器学习到更多大数据分析和物联网应用程序,到容器即服务甚至区块链技术的所有内容。这些趋势将在公共云基础设施中产生大量数据,这些基础设施需要按时高效地运行,以满足企业和最终用户的期望。

关键字:公共云

原创文章 企业网D1Net

优化公共云基础设施以实现最佳性能 扫一扫
分享本文到朋友圈

关于我们联系我们版权声明友情链接广告服务会员服务投稿中心招贤纳士

企业网版权所有©2010-2018 京ICP备09108050号-6

^