数据中心运营:人工智能和机器学习如何提高效率和弹性

责任编辑:cres

作者:Louis

2023-05-15 14:45:00

来源:企业网D1Net

原创

人工智能和机器学习可以帮助企业确定如何重新设计现有的数据中心,使其不那么僵化和孤立,从而使其更可靠。

运营数据中心必须提供更细粒度的实时数据,以保持数据中心的运营弹性、响应性和在线性,尽管存在潜在的安全和中断威胁。不可预测的供应链、长期的劳动力短缺、螺旋式上升的通货膨胀和能源成本等,是企业CIO和高级管理团队在优化数据中心时面临的一些挑战。
 
EkkoSense公司美洲副总裁特Tracy Collins表示,“从现在到2025年,工作量将继续以每年20%左右的速度增长,数据中心正在努力满足这些不断升级的需求。”
 
戴尔公司人工智能战略主管Brons Larson表示,“数据中心可以利用人工智能和机器学习来提高性能,优化配置和部署。”
 
阿里云智能高级总监兼首席工程师Wendy Zhao补充说:“人工智能和机器学习继续在它们的发展中取得巨大进步,它们现在对数据中心运营和IT管理产生了切实的影响。”
 
根据IDC公司发布的数据,由于嵌入式人工智能功能,数据中心50%的IT资产将自主运行。该公司表示,对于投资人工智能以实现IT基础设施自动化的企业来说,提高客户满意度、自动化决策和重复任务是企业获得的最大好处。
 
人工智能和机器学习获得采用
 
去年,一半以上(57%)的数据中心运营商表示,他们相信人工智能可以做出日常运营决策,高于2021年的49%。考虑到数据中心的许多任务都是人工密集型的,人工智能和机器学习可以显著降低成本,并提高效率。
 
一些CIO表示,他们对应用基于人工智能和机器学习的解决方案感兴趣的领域是,解决诸如减少停机、加强多站点弹性、优化直接液体冷却以及改进容量规划以及安全性等具有挑战性的问题。
 
数据中心的能源成本正在飙升,这意味着运营商在预算范围内运营数据中心更具挑战性。数据中心运营商和企业CIO正专注于评估软件设计的电源和人工智能如何帮助企业以指数方式降低能源和冷却成本。
 
Equinix公司是一家为许多全球领先企业提供数据中心服务和网络基础设施的全球供应商,该公司的CIO Milind Wagle表示,Equinix公司在全球26个国家运营着220多个数据中心,他们正在使用人工智能来估算他们的数据中心将消耗多少电力和空间,进而调整他们的互联网“引擎”。
 
人工智能可以在哪些方面帮助优化数据中心性能
 
利用人工智能技术,CIO和数据中心运营商可以优化功耗并提高能源使用效率,以实现未来的效率提升。随着整个行业可持续性压力的增加,许多数据中心运营商还没有做好满足碳排放报告要求的准备。
 
此外,数据中心中断仍然是代价高昂且频繁的,云计算应用程序尤其容易受到影响。人工智能有可能通过提高效率、减少中断和简化操作来帮助解决许多这些问题。以下是人工智能可以帮助优化数据中心性能的关键领域:
 
(1)改进容量规划和资源分配
 
实时数据对于任何数据中心的容量规划和资源分配都至关重要。实时数据可以让人们了解需要优化的地方、方式和内容,以提高数据中心性能。一个关键领域是确定容量规划和负载平衡中的瓶颈。这些都是基于约束的问题,监督机器学习算法擅长解决这些问题。正确进行容量规划和资源分配对于在预算范围内运行蓬勃发展的数据中心至关重要。
 
(2)可以帮助提高数据中心的安全性
 
通过学习网络的正常行为并检测异常和偏差,人工智能可以帮助防止大规模数据泄露和黑客攻击。人工智能网络安全工具可以彻底筛选和分析所有传入和传出的安全威胁数据。
 
“永远不要信任并始终验证”是企业实现零信任安全的原则,这种方法不信任任何用户、应用程序或设备,除非安全策略明确允许。企业可以提高混合环境的可见性、安全性和遵从性,同时通过采用零信任的策略来降低成本。
 
(3)减少碳足迹
 
人工智能擅长识别不同的数据模式,并帮助企业建立适合数据随时间变化的模型。事实证明,监督式机器学习在解决复杂的基于约束的碳减排问题方面是有效的,这些问题涉及数百个影响碳排放的潜在变量和因素。
 
实现可持续发展意味着将人工智能和机器学习的优势结合起来,在减少碳足迹方面表现出色。它太重要了,不能听凭运气,它对企业有重大影响。CIO们表示,他们看到同行的薪酬计划与ESG目标挂钩,将可持续发展作为减少碳足迹的重中之重,并将其作为工作的核心。
 
(4)随着时间的推移,提高正常运行时间维护水平和基准数据中心性能
 
企业需要了解特定类型的服务器比其他类型的服务器更需要重建的原因,确定导致电源管理系统中断的原因,以及排除资源平衡不起作用的原因,这些都是机器学习可以帮助解决的问题类型。关键是实现实时数据监控,并构建一个可以跟踪所有可用变量以排除性能瓶颈的数据集。
 
监督机器学习模型在预测准确性方面表现出色。挖掘机器数据并构建模型来预测给定服务器何时需要预防性维护,可以节省时间和成本。将数据中心中每个资产生成的实时数据视为跟踪性能所需的智能,并找到改进的新方法。
 
(5)结合人工智能和机器学习的优势,实现冷却、电力、电力和安全系统的自动化
 
数据中心运营商的目标是建立一个能够自主运行的数据中心。通过捕获实时数据,跟踪空气温度、冷却、电力负载、内部气压、资源负载和服务器性能,可以实现这一目标。促使CIO和数据中心运营商合作实现这一目标的原因是,需要根据高级管理层设定的可持续性和ESG目标来衡量数据中心的绩效。
 
使用机器学习来解释和创建基于环境监测和控制的模型对于衡量ESG目标的进展至关重要。人工智能和机器学习需要广泛用于跟踪电源和冷却消耗,这是运行数据中心成本最高的两个领域。
 
识别数据中心中的人工智能用例
 
确定人工智能可以在哪些方面为保护和优化数据中心做出最大贡献,必须从运营成本和安全性风险最大的地方开始。一些CIO表示,寻求新的方法来减少能源消耗,以实现碳减排和可持续发展的目标,这一挑战需要与他们持续面临的员工短缺相平衡。
 
正确进行冷却、空间、电源和服务器优化是保持数据中心在预算范围内运行和避免潜在停机的核心。据估计,数据中心仅冷却基础设施就消耗了35%的能源。根据Uptime Institute公司发布的《2022年全球数据中心调查》报告,优化数据中心冷却、选择更多可再生能源和提高IT利用率可以将可持续性收益提高57%。
 
在数据中心使用人工智能的新用例包括效率风险分析、容量规划、安全和预算影响预测。在网络安全领域,使用人工智能来缩小IT和OT系统之间的差距是既定的,为每个数据中心和系统定义最低特权访问和身份管理也是如此。
 
关于企业网D1net(www.d1net.com):
 
国内主流的to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营19个IT行业公众号(微信搜索D1net即可关注)
 
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

链接已复制,快去分享吧

企业网版权所有©2010-2024 京ICP备09108050号-6京公网安备 11010502049343号