访阿特斯李科:从全球灾备韧性到AI敏捷性 看光伏巨头的IT架构升维之道

责任编辑:shjiaz

作者:查士加

2025-07-30 09:31:19

来源:企业网D1Net

原创

AI 时代的 IT 架构突围:阿特斯李科谈算力、合规与全球化破局之道

当 AI 大模型掀起算力军备竞赛,当出海浪潮倒逼全球化架构重构,企业 IT 基础架构正站在“性能突围”与“安全合规”的十字路口。

作为横跨国内外市场的绿色能源龙头,阿特斯阳光电力集团的 IT 架构实践颇具样本价值:既要应对 AI 训练的算力洪峰,平衡 ESG 合规下的能耗压力;且要支撑全球 48 小时不间断的灾备演练以保障业务连续性;又要适配海外新兴市场的本地化法规与技术需求;还要在成本可控的前提下实现跨区域资源的高效协同。这种 “多线作战”的场景,恰是当下中国出海企业在 IT 架构升级过程中面临的真实挑战。

在这场技术与业务的深度耦合中,企业如何破解“高性价比算力获取难”“跨区域合规成本高”“全球化协同效率低”等核心难题?如何在服务器、存储、网络的选型中找到“创新与稳定”的平衡点?又该以怎样的策略应对 AI 时代的架构挑战?

带着这些问题,企业网D1net专访了阿特斯阳光电力集团股份有限公司 集团IT高级总监李科。从 IT 架构面临的共性挑战到采购需求的迭代,从技术创新与稳定性的平衡艺术到全球化布局的实战经验,李科结合企业实践,拆解了 AI 时代 IT 基础架构的突围路径,为同行提供了一份兼具战略高度与落地性的参考样本。

阿特斯阳光电力集团股份有限公司 集团IT高级总监李科

以下为对话实录(内容有所精简,便于阅读):

企业网D1net: 在AI时代/大数据爆发的背景下,您认为企业IT基础架构面临的最大挑战是什么?

李科:尽管不同企业的应用场景存在差异,但整体来看,企业对 AI 的需求正处于急剧增长的阶段。这种爆炸式增长的需求,使得很多企业都面临着共性问题 —— 需要应对更复杂的数据分析、实现更快的处理速度,同时满足更高的存储容量要求。​

具体来说,面临的挑战主要体现在三个方面:​

第一个挑战是高性价比算力的获取难度较大。当前环境下,一方面海外相关产品存在使用限制,且价格偏高;另一方面国产产品正在快速崛起,但不同产品的技术路径存在差异,这让企业在选择时面临不小的困难。​

第二个挑战是训练与使用成本的显著增加,其中训练成本的压力尤为突出。企业需要投入巨额费用,不仅包括硬件采购或租赁成本,还涉及配套设施的搭建,此外对专业技术人员的需求也大幅上升,这些都推高了整体支出。​

第三个挑战则与需求的弹性变化相关。计算需求并非 24 小时保持稳定,而是存在明显的峰值与低谷,如何应对这种波动也是企业需要解决的问题。

而且,在实际操作中,还有几大挑战值得关注。一是需求与资源的精准匹配难度大,还要兼顾成本控制。尤其在人才层面,模型计算等工作需要具备数学、数据及推理能力的专业人才,而这类人才目前十分短缺。二是部署复杂度方面的新难题,并非一套设备就能覆盖所有应用场景,还需要专门的计算公式提供支撑。

除此之外,数据安全与隐私保护也是突出挑战。由于相关数据需上传至 AI 环境,如何有效控制数据访问权限成为关键。AI 本身无法判断访问者是否具备获取数据的资质,一旦发生重要数据泄露,可能引发经济损失、名誉受损乃至法律风险等一系列问题,这就需要加密、管控、审核、保护等技术形成全方位支撑。​

同时,技术层面还面临数据吞吐 IOPS 的考验。AI 应用对高性能读写计算的需求,不仅要求核心设备达标,中间数据传输环节也需要配套设备支撑,并非单一设备能解决。

随着算力提升,能耗与碳排放的压力也日益凸显。作为从事绿色能源、清洁能源业务的企业,我们公司在 ESG 合规方面做出了相当大的投入。这与马斯克关于“AI 产业的瓶颈是能源”的判断十分契合。

最后,可靠性要求也不容忽视。当 AI 技术投入生产经营,尤其是制造业的生产环节,系统的稳定性和中断成本是必须重点考量的问题。

企业网D1net: AI时代,您的企业在IT基础架构方面诞生了哪些新的采购需求?与过去几年相比,IT采购需求发生了哪些变化?

李科:过去,我们的采购模式相对简单,主要以服务器、存储、网络设备这三大件的采购为主。而现在,尽管还是以这三大件为基础,但更倾向于采购一套完整的解决方案,不再局限于单一硬件,还包括软件、软件授权、专业运维服务、云服务,以及 AI 工具和优化工具等等。​

另一方面,面对巨大的算力需求,如果直接采购硬件需要承担高昂的成本,因此我们也会考虑云计算的弹性资源,无论是公有云、私有云还是混合云,按需付费的模式能更好地平衡需求和成本,这也是采购时需要综合考虑的关键因素。​

第三,在 AI 计算场景,算力间的通讯对网络性能提出了更高的要求,因此我们对高性能AI计算网络有明确需求,需要依托400G或800G的高效带宽来支撑数据传输。​

最后,数据安全与隐私相关的服务也纳入了采购范畴。综合来看,如今的采购已从单一硬件采购,转向了对整体解决方案的需求

企业网D1net:下面请您展开谈谈,在采购IT基础设施产品和解决方案时,您更看重哪些主要因素?

李科:我们可以分品类来谈。在服务器采购上,首要关注的是性能与能效的平衡。这不仅涉及CPU的核心数与主频,在 AI 训练场景中,是单核算力水平更高,还是多核承载的任务数更多?需要考虑这之间的能力平衡。其次,对内存与存储的要求与以往不同,以往64G、128G内存基本够用,现在通常以256G起步,部分场景达到500G以上甚至1TB;同时,也要求存储具备高性能、高速网络适配及高速读写能力。此外,服务器的可扩展性与可管理性也是核心考量点。​

对于存储产品,性能与成本的平衡是关键,既要聚焦高性能、低延迟,容量与成本之间的关系,也要关注访问速度、带宽等指标参数。而数据保护性更是不容忽视,它直接关乎数据保密与隐私安全,是一个重要方向。​

采购数据保护类产品的要求更为严苛:既要考虑数据的一致性和备份的完整性,又要满足高规格的数据保护要求——包括目标恢复时间(RTO)的设定、大规模数据库应用的稳定支持,尤其要适配未来AI 分布式训练数据集的保护需求。​

此外,IT基础设施产品的开放性、互操作性,是否具备简洁易用的操作界面或系统平台,以及管理便捷性、售后服务质量,也是我们采购时需重点考量的方向。

企业网D1net:您如何平衡技术创新与架构的稳定性?比如会优先考虑模块化设计还是性能极限?

李科:这种平衡是个比较大的话题,主要取决于我们的需求场景。首先,核心业务系统,比如制造业的 ERP、财务系统,以及生产制造系统,稳定性是首要优先级,这毋庸置疑。其次,对于新业务或新技术,可以引入一些创新,但多为试探性、方向性的尝试,不会投入大量资源。对于一些混合应用,则需要结合本地部署或云场景去综合考量。​

当然,安全性一直是被高度关注的问题,近期已经有一些因为AI训练导致信息泄露而被起诉的报道,这类问题需要高度重视。

企业网 D1net:模块化设计呢?

李科:模块化也区分不同的场景。比如,当预算有限,但业务增长模式或业务模式比较清晰时,模块化肯定是优先选择,可以采购一些性价比比较高的物理设备或是集成式设备,之后再按需定制、进行模块化扩展。​

如果对性能或规模要求比较高,比如一些大规模的并发数据处理、低延迟场景,尤其是AI 推理场景,可以优先考虑性能,这种情况我们自己也遇到过。

而对于负载较轻的场景,选择常规设备即可,这类设备在计算、内存、IO 等方面的配置通常比较均衡。

企业网 D1net:当前出海已成为企业发展的必选项,而在拓展海外业务时,通常要面临诸多挑战。您的企业在出海过程中遇到的比较突出的 IT 架构方面的挑战有哪些?

李科:突出的挑战集中在几个方面。一是需要满足不同地区的法规要求,难度很大,因为适用的对象和区域都不同,比如 AI 训练中训练结果的存储、训练过程数据的传送都有严格规定,而满足这些要求必然要投入相应的资源和成本。​

二是合规成本极高,不仅包括首次投入的开支、日常开支和运营成本,还包括数据的物理隔离、法规认证以及专业认证人员的投入等等。​

三是出海后,全球化IT基础设施的维护难度增加,技术和人力投入也面临更多挑战。

其他方面还包括:部分数据需要实时传递,如何在全球化架构下提高数据的传输效率?运维层面,跨地域的指标数据监控、指标参数的统一规范化,以及告警处理都会变得困难,因为这涉及不同地区、不同需求和不同团队的协同。​

从技术层面来看,还有几个方面:一是在全球化架构下,考虑以云优先建立容灾备份,同时兼顾本地或边缘端的架构和数据管理;二是做好合规化审计,国内要满足信创要求和安全管控,国外则需符合不同国家在系统和数据管控、访问授权策略等方面的管控要求。​

此外,我们更看重具备全球化服务与合规能力的厂商,尤其在海外部署、全球物流、本地化售后支持以及备品备件供应等方面,需要具备完整的支撑能力。

企业网D1net:针对您刚刚提到的这些挑战,有比较成熟的应对方法吗?

李科:有的。作为中美两地上市企业,阿特斯阳光电力集团既要符合国内等保等法规要求,也要满足美国上市体系对数据管控的要求。因此我们更倾向选择具备以下特性的解决方案:一是开箱即用或开源自用属性的方案,能同时满足国内外法规要求;二是完整的安防工具链,包括审计、漏洞扫描、日志检查和自动化报告等工具;三是完善的数据生命周期管理机制。这些都是我们当前正在推进落地的工作。

灾难恢复方面,我们前段时间刚刚完成了半年度演练,过程中需要联合不同厂商与云服务商协作。尤其是跨境灾难恢复,难度更高,这次全球化的灾难恢复演练给我们带来了新的挑战和思考,也推动我们必须在这方面提升能力。​

作为跨国企业,我们需要一套适配各地法规的系统,同时基于核心的ERP 系统,我们也希望以构建生态圈的方式实现多方的协同支持。

比如上次的灾备演练就是个很好的案例:由国内云服务厂商提供底层技术架构,应用层由国际知名ERP厂商提供相应的服务,与我们共同完成了全球48小时不间断的灾备恢复演练,通过不同团队接力配合达成目标。

目前在海外数据中心建设上,我们已与当地电信运营商及出海的中国运营商开展深度合作,积累了成功案例——包括全套数据中心整体解决方案的交钥匙工程,且部分关键厂商提供 7×24 小时技术支持服务。

企业网D1net:您刚刚提到了全球 48 小时不间断的灾备演练,这类大规模跨区域演练对协同效率、技术支撑的要求极高,能否具体分享下这次演练的经验?

李科:这次全球灾备演练,确实为我们积累了一些经验。首先,全球化的协同机制非常重要。由于数据量大、覆盖区域广,整个演练过程需要不同区域的团队无缝接力。比如中国区由中国区团队接手,完成后由北美团队继续,接下来再交由欧洲团队推进,整个过程通过清晰的“交棒”机制保障连续性。此外,交棒时还会明确交接节点的责任人,也会记录整个过程和进度,确保 48 小时内灾备流程不中断。

其次是技术与服务的适配性,底层架构与应用层的跨厂商协作必须高效。由云服务厂商提供全球分布式资源支撑,应用层厂商保障核心系统在灾备场景下的稳定运行,二者配合实现数据流转、恢复的精准衔接,这对技术兼容性、响应速度的要求远超常规场景。

三是大型厂商的全球化支持能力。跨国协作中,语言与沟通效率直接影响演练成效。这次演练初期,我们采用英文交流,为了减少信息偏差和误解,我们向厂商提出了中文支持服务的需求。因此从第二个交棒节点开始,各区域均由华人团队对接,母语沟通不仅大幅降低了误解的风险,更确保了信息的精准传递,这对高压力场景下的问题快速响应至关重要。

最后是团队稳定性的保障。48 小时内尽量保持核心支持人员的连续性,同一工程师可能在不同时段参与两次关键操作,这样做既避免了信息断层,也让团队对演练全流程有更连贯的把控,这对提升整体效率帮助很大。

总的来说,这次演练让我们深刻体会到,大规模全球灾备不仅是对技术能力的考验,更是对厂商全球化服务网络、跨区域协同体系及本地化支持响应能力的综合验证,这些经验也为我们后续优化全球 IT 架构提供了重要参考。

企业网 D1net:最后想请教一下,站在同行视角,您认为 IT 基础架构选型有哪些核心策略?最想分享的经验是什么?

李科:总结下来有几个关键点,希望能给同行一些参考。

第一,优先考量厂商快速响应、故障诊断与解决的能力。这一点我们有切身体会,比如厂商的呼叫支持中心是否完善?国际厂商会通过内部工单初步判断问题,再由全球后端资深工程师按时效处理,远程快速响应,即使复杂问题也能高效推进。

第二,重视深度技术理解与协作支持。以我们部署的 AI 场景为例,国际厂商会提前深入沟通实际需求和潜在难点,甚至能提出我们未考虑到的问题和方向;现场服务也很高效,从需求提出到下单交付、安装调试,不到一个月就完成了,这对业务快速落地起到了关键作用。

第三,出海业务需匹配全球化一体化的解决方案。对出海企业来说,尤其像我们要在中东、非洲等新兴市场布局,合规性与本地化支持至关重要。国内厂商在这方面仍有局限,而国际厂商能提供覆盖全球的合规服务与支持体系,这种能力是我们非常看重的。

此外,选型前还要做好自身规划:

1、先明确目标方向,比如是优先公有云、私有云还是混合云,这取决于企业整体战略。

2、梳理具体应用场景 —— 无论是 AI 运算、模型训练、数据库层面的大数据的抽取/计算/展现,还是虚拟化部署(如计算虚拟化、存储虚拟化、GPU虚拟化),不同场景需匹配不同解决方案。比如我曾经参与建设的一个典型场景,通过 GPU分片虚拟化实现数百台虚拟化服务器的 GPU 算力分割,支撑上千用户同时使用,这类场景就需要针对性方案。

3、架构转型要结合企业实际需求。比如生产制造场景需要快速响应,适合本地化部署,云架构未必适配;核心系统建议放在本地,非核心数据的存储与协同可通过云快速落地。

4、IT基础设施的选型决策要以业务为驱动,不能局限于单一品牌,应综合多品牌优势,平衡成本与性价比。

简单地说,选型就像选车:先想清楚 “要去哪、可能遇到什么情况”,再决定选轿车还是越野车。厂商能提供全局支持当然更好,但核心是匹配自身业务需求,这才是关键。

关于企业网D1net(www.d1net.com):

国内头部to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。

下半年精品CIO系列活动

2025全国汽车业数智化大会 9月12日 杭州

2025全国制造业数智化大会 9月13日 杭州

2025第十七届央国企CIO及数科公司高管峰会 9月27日 北京

2025全国甲方IT选型大会 11月14日-15日 华东

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号