Kubernetes成本持续攀升,AI能否带来转机?

责任编辑:cres

作者:Grant

2025-08-20 16:16:51

来源:企业网D1Net

原创

最近的一项调查发现,绝大多数使用Kubernetes进行容器编排的企业在过去一年中花费更多,如今许多企业正转向AI来帮助控制成本。

容器化应用在云端为企业带来诸多优势,但该行业一个鲜为人知的秘密是,管理这些应用的成本却并非优势之一。

根据最近的一项调查,绝大多数使用Kubernetes进行容器编排的企业在过去一年中花费更多,如今许多企业正转向AI来帮助控制成本。

Kubernetes管理供应商Spectro Cloud的调查显示,约88%的受访者表示其总拥有成本在过去一年中有所增长,而92%的受访者表示正在投资基于AI的成本优化工具。

Spectro Cloud现场首席技术官杰里米·奥基(Jeremy Oakey)表示,尽管成本上升不仅体现在硬件、云服务和支持合同上,但这些成本的增加往往伴随着Kubernetes使用量的增加。

他补充道,员工成本也是一个因素,平台工程师的年薪往往接近20万美元,其他成本还包括部署和维护边缘集群的现场工程费用,以及开发人员花费过多时间管理集群时产生的生产力成本。

奥基说,虽然使用量的增加是总体成本上升的主要原因,但其他问题,如资源过度配置,也会加剧这一问题。

他补充道:“预测Kubernetes资源需求颇具挑战性,因此开发人员往往会设置宽松的配置参数以防万一,大规模部署时,这种行为会导致集群数量显著增加。”

奥基表示,架构决策是另一个主要的成本驱动因素,云间的数据进出可能费用高昂,而在边缘运行多节点集群也会增加支出。

他说,Kubernetes团队在使用该工具时需要保持自律。奥基建议,他们应考虑是否停用未使用的集群、缩减资源规模、设置适当的自动扩展阈值,并审查日志保留和存储配置等策略。

部署选择不当

数字化转型和云迁移公司Pvotal Technologies的首席执行官亚辛·曼拉杰(Yashin Manraj)认为,配置不当、资源过度配置和未优化是企业在基于Kubernetes的环境中花费更多的主要原因。

曼拉杰说:“人们倾向于将Kubernetes视为静态虚拟机或服务器,这种做法会留下许多孤立资产,并且无法真正理解其应有的作用,我认为,主要问题在于在使用Kubernetes时面临压力,但却没有一支了解编排复杂性或有效管理集群的控制平面的团队。”

云管理平台供应商CloudBolt Software的首席运营官亚斯敏·拉贾比(Yasmin Rajabi)补充道,过度配置Kubernetes是默认的部署方式,大多数团队会为CPU和内存配置充足的缓冲,以避免在深夜被紧急呼叫。

她说:“开发人员和平台工程师的激励机制并不一致,开发人员的考核标准在于他们能多快部署新应用并推动业务发展,他们没有受到成本效率方面的压力,因此最简单、最安全的做法就是确保工作负载有充足的资源缓冲。”

但拉贾比补充道,这些缓冲成本在数千个Kubernetes工作负载中会迅速累积。

拉贾比说,此外,动态工作负载难以预测,而且大多数企业没有所需的工具来根据不断变化的工作负载需求持续调整资源请求和限制,同时,调整资源规模是一个手动且耗时的过程。

她说:“部署到Kubernetes很容易,但管理起来却很难,Kubernetes使企业能够以所需的速度部署影响业务的应用,并具备创新和更快进入市场所需的灵活性,然而,承诺的便捷性和速度与大规模管理Kubernetes的复杂性及其带来的成本相矛盾。”

CPU利用率不足

数字营销机构NEWMEDIA.com的创始人兼首席执行官史蒂夫·莫里斯(Steve Morris)表示,过去一年,该公司的Kubernetes支出增长了18%,主要原因是劳动力成本和莫里斯所说的分散的扩展选择。当该公司审查其Kubernetes自动扩展选择时,发现31%的工作负载在一天中95%的时间里CPU使用率低于25%。

他说:“当发布团队管理自己的集群并定义自己的[自动扩展器]规则时,会导致保守的过度配置被锁定在他们的配置文件中,工程师们不愿下调资源,因为他们担心这可能会引发事故或导致无法满足服务水平协议(SLA)。”

莫里斯说,当两名平台工程师每周有一半的时间用于调整容量和处理嘈杂的警报时,劳动力成本就会增加。“随着每个新服务的增加,运营开销也会增加,而不仅仅是随着流量的增加,当你让团队自行做出资源决策时,虽然可以加快交付速度,但也会分散成本责任并隐藏浪费。”

Kubernetes的普及加剧了人们对成本的担忧。Pvotal的曼拉杰说,由于Kubernetes是许多客户IT基础设施的核心,因此成本上升不太可能消失,他说:“我们认为,随着采用率的提高,以及设计不佳的工具的泛滥和对第三方的依赖,这个问题只会愈发严重。”

Pvotal尚未找到管理Kubernetes成本的自动化解决方案。“我们定期测试所有新工具和技术,”他说,“不幸的是,除了一个比谷歌云平台(GCP)默认工具更能跟踪使用情况的仪表盘外,我们还没有发现任何能为我们或我们的客户带来价值的其他工具。”

转向AI

尽管如此,其他人表示,管理Kubernetes的复杂性促使从业者考虑使用AI驱动的管理工具。

CloudBolt的拉贾比说:“资源分配是复杂且多维的,这实际上意味着它是一个复杂的数学问题,这正是AI和机器学习工具可以发挥作用的地方,它们可以帮助解决应该设置什么资源的复杂数学问题,并结合自动化,用正确的设置来实际配置工作负载。”

Spectro Cloud的奥基说,现在有少数供应商提供自主调整资源规模和智能自动扩展服务。

奥基说:“我们看到AI成本优化工具领域正在迅速发展,Kubernetes管理和FinOps领域的供应商正在汇聚。在管理方面,这些工具持续监控实时容器组利用率,从历史使用模式中学习,并自动调整资源请求、节点规模,甚至调整竞价实例和按需实例之间的平衡。”

与此同时,FinOps供应商正在集成AI和机器学习功能,以实现主动成本控制措施。

奥基说:“虽然并非所有这些功能都代表了最先进的AI形式,但我们确实看到,整个工具链正在明显地向嵌入更强大的智能和自动化功能的方向转变,这种融合正在创造一种更复杂、更主动的Kubernetes成本优化方法——将运营控制与财务责任相结合。”

奥基补充道,CIO应采用一切可用策略来控制成本,包括与云供应商谈判和使用自动扩展功能,他还建议,CIO应使广泛的架构决策与企业的业务目标保持一致。

这些决策可能包括CIO是用基于云的操作费用取代数据中心租赁费用,还是通过自动化简化运营来战略性地减少IT人员数量。

然而,他补充道,CIO还应确保区分成本和投资,特别是在AI时代。

他说:“部署Kubernetes集群以支持具有变革性、能创造收入的应用,不仅仅是一项开支,更是对创新和竞争优势的投资,那么,核心问题就变成了:你的Kubernetes基础设施是否在为你的应用团队提供速度、选择和灵活性等方面的最大价值。”

企业网D1net(www.d1net.com):

国内头部to B IT门户,旗下运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。

版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号