自OpenAI于2022年推出ChatGPT以来,GenAI已大规模进入企业领域。根据Precedence Research的数据,2024年全球GenAI市场规模已超过250亿美元,并预计到2033年将达到惊人的8030亿美元。同时,宾夕法尼亚大学沃顿商学院的沃顿AI和分析倡议组织(AI at Wharton)与咨询公司GBK Collective的一项针对高层决策者的研究发现,2024年拥有1000名或更多员工的企业在GenAI上的投资平均比2023年高出了一倍以上。
然而,德勤最近的一项调查显示,尽管大多数董事级至高管级的受访者在使用或实施GenAI计划方面有经验,并计划在下一个财政年度增加其整体AI支出,但他们的态度较为谨慎,预计在未来几个月内,只有30%或更少的GenAI实验能够全面推广,这反映了他们手头可用的工具状况。因此,鉴于当前的获取和采用环境,以下是当前企业中最常用的10种GenAI工具。
ChatGPT
ChatGPT是OpenAI推出的一款聊天机器人应用程序,它建立在生成式预训练转换器(GPT)模型之上。自2022年推出以来,它已成为企业中最常用的GenAI工具,沃顿商学院最近的调查显示,62%的受访者表示他们目前正在使用它,28%的受访者表示他们目前尚未使用但正在评估或测试它。
ChatGPT的优势在于自然语言的理解和生成,使其成为应对复杂语言挑战的优秀工具,包括自动化和改进客户服务、通过处理重复性查询来简化运营、生成报告、起草电子邮件以及创建产品描述等。
与所有GenAI一样,ChatGPT的准确性可能会有所不同,而且它无法理解情绪,这可能会在某些情况下引发问题。因此,可能需要人类监督和干预。
Microsoft Copilot
Microsoft Copilot是嵌入在Microsoft 365中的一款对话聊天界面,旨在增强Word、Excel、PowerPoint、Outlook和Teams等应用程序的生产力。它于2023年推出,利用OpenAI的GPT-4基础大型语言模型(LLM),是第二大常用的GenAI工具。根据沃顿商学院的调查,52%的受访者表示他们的企业目前正在使用Copilot,35%的受访者表示他们正在评估或测试它。
Copilot的强项在于它与Microsoft 365环境中员工全天使用的生产力应用程序的集成。它遵循企业已有的安全、合规和隐私政策,并可作为现有Microsoft许可证的附加组件提供。其用途包括:
• 在Word中起草文档和摘要文本
• 根据Excel中现有数据生成图表
• 在PowerPoint中创建大纲和设计幻灯片
• 管理Outlook收件箱、摘要电子邮件线程和起草回复
• 汇总Teams会议的关键点并创建待办事项
• 利用Power BI通过自然语言查询创建报告和可视化内容
与ChatGPT一样,Copilot的准确性并非完美。例如,在总结内容时,它可能会遗漏要点或忽略关键细节。同样,即使在使用品牌材料、文案和图像时,其输出也不一定符合品牌标准。用户需要关注其输出。
Google Gemini
Google Gemini(前身为Bard)是一款基于Google的Gemini多模态AI模型构建的对话聊天机器人。沃顿商学院的调查显示,40%的受访者表示他们目前正在使用Gemini,39%的受访者表示他们正在评估或测试它。
与ChatGPT和Microsoft Copilot相比,Gemini在2023年推出时,在多模态功能方面处于领先地位——除了文本之外,它还能够处理和生成图像、音频和视频。Gemini与Gmail、Docs和Slides等Google Workspace工具集成。
Gemini的潜在用途包括:
• 根据Smart Email Composer的提示起草电子邮件
• 根据提示在Google Slides中创建幻灯片演示文稿
• 通过Spreadsheet Analyzer在Google Sheets中识别趋势、异常值和相关性
• 为Google Meet视频会议生成背景插图并模拟专业照明,甚至改善音频体验
Gemini与Google Workspace的集成使其成为在使用Workspace的环境中出类拔萃的工具,但在此类环境之外,其效用有限,因为它在Google的安全环境中运行。与ChatGPT和Copilot一样,准确性可能是一个问题,因此建议对人类监督其输出。
Meta AI
Meta AI是Meta为其消息和社交媒体应用程序(包括Facebook、Instagram、WhatsApp和Messenger)打造的多模态AI虚拟助手。与Gemini一样,沃顿商学院的调查显示,40%的受访者表示他们目前正在使用Meta AI,36%的受访者表示他们正在评估或测试它。
Meta AI由Meta的Llama大型语言模型(LLM)提供支持,用户可以利用它在公司的应用程序中提供建议、回答问题、编辑图像和提供翻译。企业可以使用Meta AI来设置虚拟助手,这些助手可以:
• 自动化客户互动,包括回答问题和提供个性化建议
• 在Meta的应用程序内促进交易
• 分析数据,以帮助企业创建有针对性的营销活动
Meta AI已经与许多客户在线花费大量时间的应用程序集成,但访问客户数据可能存在隐私和道德问题。
Dall-E 3
GenAI不仅仅关乎聊天机器人和虚拟助手。同样来自OpenAI的DALL-E 3专注于根据文本描述生成视觉内容,沃顿商学院的调查显示,30%的受访者表示他们目前正在使用DALL-E 3,35%的受访者表示他们正在评估或测试它。OpenAI于2021年推出了原始的DALL-E模型,而DALL-E 3深度学习模型则利用计算机视觉和自然语言处理来创建视觉内容。其潜在商业用途包括产品构思、应用程序原型设计、标志设计、为社交媒体帖子和教育材料创建图像和视频等。
在AI图像生成器中,DALL-E 3的强项在于它与ChatGPT的集成,但许多用户表示,它在逼真度方面存在困难,具有一种独特的风格,使得很容易识别出模型生成的图像。
RunwayML Gen-1和Gen-2
Runway利用文本、图像和视频输入(包括由其他GenAI工具生成的内容)来生成视频,沃顿商学院的调查显示,25%的受访者表示他们目前正在使用Gen-1和Gen-2,31%的受访者表示他们正在评估或测试这些模型。
2023年发布的Gen-2模型扩展了Gen-1模型的功能,允许创建长达18秒的视频。用户可以指导相机的移动以定制内容,并将片段拼接在一起以创建更长的视频。除此之外,企业还可以使用该工具来制作静态资产的动画、视觉效果和故事板。
Runway的某些功能学习曲线较陡峭,而且可能会占用大量资源。
Stable Diffusion
Stable Diffusion是Stability AI于2022年推出的一款深度学习模型,它可以根据文本和图像提示生成高分辨率、逼真的图像。它还可以创建视频和动画,沃顿商学院的调查显示,24%的受访者表示他们目前正在使用Stable Diffusion,33%的受访者表示他们正在评估或测试它。
Stable Diffusion基于一种潜在扩散模型,该模型所需的处理能力远低于一些竞争对手,因此它能够在配备消费级GPU的台式机和笔记本电脑上运行,而不局限于云服务。
Stable Diffusion的潜在商业用途包括医学成像、为目录生成视觉内容、设计数字原型、创建概念艺术和故事板,以及图像编辑(包括色彩校正和降噪)。
Midjourney
Midjourney是一款根据自然语言提示生成图像的工具。自2022年推出公开测试版以来,沃顿商学院的调查显示,23%的受访者表示他们目前正在使用Midjourney,32%的受访者表示他们正在评估或测试它。
可以通过Discord通信平台或该工具的官方网站访问Midjourney。
通过Midjourney商业许可证创建的图像可用于商业用途,但除非经过人类的重大改造,否则不能享有版权。因此,未经人类艺术家改造的Midjourney创建的图像被视为公共领域。
Perplexity
Perplexity是Perplexity AI于2022年推出的一款基于AI的搜索引擎,它利用大型语言模型(LLMs)处理查询并综合响应,沃顿商学院的调查显示,21%的受访者表示他们目前正在使用Perplexity,33%的受访者表示他们正在评估或测试它。
Perplexity建立在Microsoft Azure之上。免费版本利用OpenAI的GPT-3.5大型语言模型,但付费用户可以选择自己的模型。其用途包括:
• 内部搜索,用于同时在网络和内部文档中搜索内容
• 金融,包括实时股票报价、价格跟踪、行业同行比较和基本财务分析工具
• Perplexity Assistant,一款适用于Android设备的基于AI的搜索助手
Claude
Claude是Anthropic于2023年推出的一款对话式AI聊天机器人,沃顿商学院的调查显示,19%的受访者表示他们目前正在使用Claude,34%的受访者表示他们正在评估或测试它。
Claude遵循Anthropic开发的宪法AI(CAI)原则,这是一种训练AI系统的方法,旨在解决透明度、安全性和无需依赖人类反馈即可做出决策方面的担忧。CAI旨在为Claude设定道德界限,使其能够拒绝回答可能造成伤害的查询。
Claude是ChatGPT等其他通用产品的替代品,企业可以利用它来自动化和改进客户服务、通过处理重复性查询来简化运营、生成报告、起草电子邮件以及创建产品描述。
Claude以其回复的清晰度而闻名,但也有冗长的倾向。
企业网D1net(www.d1net.com):
国内主流的to B IT门户,旗下运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。