如何三步落地企业AI应用?开源+“小模型”方式破解AI落地难题

责任编辑:shjiaz

作者:查士加

2024-11-05 16:54:02

来源:企业网D1Net

原创

开源AI不仅能够降低技术门槛和成本,还能通过社区协作加速创新,为企业带来更大的灵活性和自主可控性。

在数字化转型的浪潮中,人工智能(AI)已成为企业增强竞争力、提速数字化转型进程的核心驱动力。然而,在AI技术落地应用的过程中,企业往往需要跨越重重挑战。企业网D1net在与众多CIO的深入交流中发现,企业在AI落地过程中往往面临四大难题。

首先是高昂的投入成本。从硬件采购、软件系统开发到长期的运维管理,每一个环节都伴随着不菲的支出。尤其在大模型应用场景下,所需的庞大算力往往难以自给自足,租赁外部算力成为多数企业节约初期成本的主要方式。

其次是发展方向及投入产出的不确定性。AI技术与模型迭代迅速,市场格局瞬息万变,新兴初创公司层出不穷,这些因素共同导致了极高的不确定性。因此,CIO们在制定AI预算时普遍持谨慎态度,倾向于在初见成效后再逐步加大投入。

第三,高质量训练数据的稀缺性成为制约AI发展的又一瓶颈。大模型虽强,却需海量数据支撑,而在企业的实际业务场景中,数据量有限,高质量数据更是凤毛麟角。这使企业更加倾向于选择那些数据量相对较小、精度却更高的小模型。

最后,数据安全风险不容忽视。对于能源、医疗、金融、制造业等高度敏感的行业而言,模型的本地化部署需求尤为迫切。企业需确保数据在传输、处理及存储过程中的安全合规性,以防范潜在的数据泄露风险,维护公众信任与企业声誉。

红帽全球副总裁兼大中华区总裁 曹衡康

面对这些复杂且棘手的挑战,企业在AI落地过程中往往步履维艰,难以充分发挥AI技术的真正价值。在2024红帽论坛上,红帽公司携手行业领袖与顶尖生态伙伴,聚焦开源AI在企业应用中的新思路与解决方案,为破解上述难题提供了有力的支持。红帽全球副总裁兼大中华区总裁曹衡康指出,开源AI不仅能够降低技术门槛和成本,还能通过社区协作加速创新,为企业带来更大的灵活性和自主可控性,提升企业的竞争力和市场响应速度。

以开源的方式助力企业破解AI落地难题

红帽的混合云理念鼓励客户在合适的场所部署算力,比如公司内部数据中心、公有云,甚至跨多云环境。曹衡康提到,去年红帽推出了“Unlock”理念,旨在避免客户被锁定在特定云上,开源架构为客户提供更多弹性和自由度。因此,在算力支持方面,始终鼓励客户使用红帽的开放平台,以便在任意云和本地环境中灵活切换,满足各种算力需求。

曹衡康在演讲中提到,红帽一直致力于通过开源技术推动AI在企业中的应用。他介绍了红帽在开源AI领域的最新进展,包括与IBM联合发起的InstructLab开源社区项目,以及RHEL AI和OpenShift AI等产品。这些产品及工具旨在为企业提供从基础支持到高级企业服务的全方位AI解决方案,帮助企业量身打造符合自身需求的AI应用落地路径。

红帽大中华区方案架构部总经理 王慧慧

红帽大中华区方案架构部总经理王慧慧提到,针对客户在项目决策前对成本与收益的高度关注,红帽推出了创新的“三步走”实施路径,通过分阶段实施,帮助客户在确保项目可行性的同时,以灵活、高效的方式响应市场需求,最大化其投资回报率(ROI)。

第一步:轻量级试跑,降低门槛

首先,红帽允许客户在最小资源配置下,利用开源模型和工具进行初步尝试。这意味着客户仅需使用普通的笔记本电脑CPU即可开始试跑,无需额外投资昂贵的GPU卡。这一举措极大地降低了尝试门槛,使得客户能够在几乎无负担的情况下,初步验证模型的适用性和效果。

第二步:云端扩展,灵活升级

若客户对初步测试结果满意,可以进入第二步,通过云租用算力进行更深入的扩展。红帽平台几乎可在任何云上运行,客户可以选择公司自有的数据中心,也可以在外部公有云等多种环境中运行。这一步骤使得客户能够在确认模型完全满足其业务需求后,再考虑更大规模的部署,从而有效避免了资源浪费和风险。

第三步:跨云混合部署,实现最优ROI

最后一步,红帽的架构支持跨云混合部署。客户可以根据实际需要,在全球范围内灵活选择云服务提供商,例如在中国采用阿里云,在美国则使用AWS等,这种多云方案既灵活又经济。红帽的目标是帮助客户实现最佳的投资回报率(ROI),并在每一步提供适配的支持。

红帽的“三步走”战略旨在助力客户快速推广并应用AI技术,如Language AI、Code AI等。自今年5月在美国发布以来,红帽AI技术已在全球范围内引起高度关注,并在中国市场取得初步成果。

首先,红帽通过多渠道推广AI技术的独特优势,提升市场认知度。其次,构建合作伙伴生态,赋能技术与顾问团队,深化对AI技术的理解与支持。最后,设立开放实验室,与客户共同探索AI在企业场景中的应用,确保技术的精准落地。

值得一提的是,红帽已成功助力一家保险业客户引入红帽的新AI工具,仅在5个月内便完成了生产部署,加速了该公司代码审查与代码合并请求的处理,显著提升了准确率和效率。这一案例成为在中国本地开发并投入生产的首个案例,也使亚太区成为第一个实现该应用并成功投入生产的区域。

此外,红帽内部也在积极应用AI优化客户支持流程,如智能推荐解决方案、自动生成项目报告等,有效提升了工作效率与服务质量。红帽表示,将继续深化开源AI技术的应用与实践,期待更多客户分享成功案例,共同推动AI技术的创新发展。

InstructLab:对齐适合企业AI应用的“小模型”

会上,红帽在现场演示了其在AI领域的全栈解决方案,包括Granite 语言和代码模型、InstructLab、开源AI工具集、针对AI优化的Linux操作系统以及OpenShift AI平台等。这些解决方案旨在为企业提供一站式的AI开发、训练和部署服务,帮助企业快速实现AI应用落地。

InstructLab是一个用于生成式AI模型开发的开源社区项目,由红帽与IBM联合发起,帮助企业对齐适合自身AI应用的“小模型”。通过InstructLab和小模型概念,企业可以快速将知识库输入到模型中,无论采用何种模型架构,都可以通过深度数据的方式生成企业的专属模型,这种方式可以让企业快速搭建适合自身的特有模型,大幅缩短了开发周期。

值得一提的是,InstructLab和Granite是一个相辅相成的体系。王慧慧提到,设计InstructLab的初衷主要有两个:一是让客户基于Granite基础模型,使用InstructLab和自身数据训练出符合需求的模型。InstructLab的输出分为“知识(knowledge)”和“技能(skill)”,两者皆可留在企业内部自用。

二是InstructLab能将知识和技能反馈至上游的管理机构。当管理机构收到客户反馈的更新后,可以将其整合到社区版本的Granite模型中,并发布新版本。因此,InstructLab是连接社区和客户的桥梁。红帽的开源平台上,几乎所有产品都遵循这种模式。在开源模型领域,这是红帽和IBM运用这一方法进行的首次探索,旨在通过开源社区推动开源模型的持续进步,而不仅仅是开放某个版本的模型。

安利(中国)及SEWC荣获2024红帽亚太创新奖

会上,红帽宣布了2024红帽亚太创新奖中国区获奖名单。安利(中国)有限公司和西门子工业自动化产品(成都)有限公司(以下简称SEWC)获得该奖项,表彰他们在创新运用红帽解决方案应对不断变化的业务需求方面的卓越表现。

为了支持业务扩展、提升客户满意度,同时控制运营成本,安利(中国)选择红帽优化其生产供应链。通过红帽OpenShift混合云应用平台,安利(中国)实现了供应链的全面数字化协同,开创了全新的生产数字孪生应用。通过云端与边缘设备端的协同实现了全制程可视化与可追溯。

这一创新平台为安利(中国)打造了一套全新的生产数字孪生应用,极大地提升了质量追踪和原材料溯源的数字化水平。借助此平台,安利能实时洞察生产过程的每一个细节,及时发现并解决潜在质量问题,从而优化资源配置、提高生产效率、降低运营成本。此外,客户也能更透明地获取产品信息,进一步增强对安利(中国)高质量产品承诺的信心。

SEWC面临着生产连续性受到挑战的困境,包括系统灵活性和可扩展性不足、开发效率低下,以及操作不便等问题。SEWC通过部署红帽OpenShift,打造了MEMO(制造运营模块化生态系统),一个新一代集成、灵活且弹性的生产支持系统。该系统显著提升了生产线工人的用户体验和工作效率,将前沿理念付诸实践,为工业自动化制造执行系统的软件应用树立了新的标杆。

西门子工业自动化产品(成都)有限公司IT部门经理杨健表示,SEWC与红帽合作的MEMO项目显著提升了架构灵活性和开发效率,为未来业务的发展提供了有力支撑。接下来,SEWC将继续在微服务平台上与红帽深化合作,并计划利用红帽的虚拟化技术优化其现有方案。

杨健提到,小模型在生产中非常适用,因为应用和场景单一,错误率低,能保证质量和过程的可控性。而大模型有时会出现幻觉现象,在生产应用中存在一定风险。杨健对与红帽未来的合作充满期待,更对红帽AI平台表现出浓厚的兴趣,期待将其整合到西门子的资源体系中,以进一步优化制造流程。

结语

随着开源技术的不断发展和普及,开源AI已经成为推动企业数字化转型的重要力量。本次红帽论坛不仅展示了开源与AI结合的巨大潜力和广阔前景,也为企业提供了更多的选择和合作机会。

未来,红帽将继续秉承开放、协作和创新的精神,与合作伙伴和客户携手共进,共同探索开源AI的无限潜能。我们相信,在不久的将来,开源AI将在更多领域发挥重要作用,加速企业的数字化转型进程,助力企业全面提升综合竞争力。

链接已复制,快去分享吧

企业网版权所有©2010-2024 京ICP备09108050号-6京公网安备 11010502049343号