当前位置:人工智能行业动态 → 正文

Anthropic推出Claude 3,在基准测试中超过GPT-4和Gemini Ultra

责任编辑:cres 作者:Michael Nuñez |来源:企业网D1Net  2024-03-05 16:38:00 原创文章 企业网D1Net

Anthropic发布的Claude 3系列AI模型中的明星是Opus,Anthropic声称它比市场上任何其他公开可用的人工智能系统都更强大,甚至超过了竞争对手OpenAI和谷歌的模型。
 
Anthropic联合创始人兼首席执行官Dario Amodei在接受记者采访时表示:“Opus能够完成最广泛的任务,并非常出色地完成这些任务。”
 
Amodei解释说,Opus在一系列基准测试中表现优于GPT-4、GPT-3.5和Gemini Ultra等顶级人工智能模型,这包括在GSM-8K数学推理和MMLU专家级知识等学术基准方面位居榜首。
 
Amodei说:“它的表现似乎超过了所有人,在一些任务上获得了我们以前从未见过的分数。”
 
虽然Anthropic和谷歌等公司尚未披露其领先模型的完整参数,但这两家公司报告的基准结果表明,Opus在核心能力上与GPT-4和Gemini等主要替代模型不相上下,甚至超过了它们。
 
这至少在表面上为商业化的对话式人工智能建立了一个新的高水位。
 
Opus专为需要高级推理的复杂任务而设计,以其卓越的性能在Anthropic的产品阵容中脱颖而出。
 
提供中端、快速选项
 
中端模型Sonnet为企业提供了更具成本效益的日常数据分析和知识工作解决方案,保持了高性能,而没有旗舰模型的溢价标签。
 
与此同时,Haiku的设计是快速和经济的,适合面向消费者的聊天机器人等应用,在这些应用中,响应性和成本是关键因素。
 
Amodei告诉记者,他预计Haiku将在几周内公开推出,而不是几个月。
 
新的可视化功能开启了新的使用案例
 
新推出的每一种模型都支持图像输入,这是一项需求很大的功能,特别是对于图像中的文本识别等应用程序。
 
Anthropic总裁兼联合创始人Daniela Amodei告诉记者:“我们并没有把重点放在输出模式上,因为企业对输出模式的需求较少。”他强调,该公司的战略重点是最受企业欢迎的功能。
 
此外,Claude 3模型展示了与其他最先进模型一样的复杂计算机视觉能力,这种新模型开启了企业需要从图像、文档、图表和图表中提取信息的用例。
 
Daniela解释说:“很多客户数据要么是高度非结构化的,要么是某种可视化格式,仅仅是必须手动复制这些信息,才能让它与GenAI工具互动的过程就相当繁琐。”
 
法律服务、金融分析、物流和质量保证等领域可能受益于理解真实世界视觉和文本的人工智能系统。
 
走在人工智能偏见的钢丝上
 
在宣布这一消息之前,谷歌新推出的聊天机器人Gemini引发了争议,突显出科技公司在发布避免长期存在社会偏见的模型方面面临的困难。
 
上周,人们发现,促使Gemini生成历史图像导致的描述似乎夸大了种族描述,例如,要求提供北欧海盗或纳粹士兵的照片所产生的种族多元化群体的图像不太可能反映历史现实。
 
谷歌的回应是禁用了Gemini的图像生成能力,并发表了道歉声明,称其在努力增加多样性方面“没有击中目标”,然而,专家表示,这种情况说明了人工智能领域围绕偏见不断进行的平衡行动。
 
Dario Amodei在接受采访时强调了指导人工智能模型的难度,称其为一门“不精确的科学”,他说,该公司有专门的团队来评估和缓解他们的模型中的各种风险。
 
“我们的假设是,站在人工智能发展的前沿是引导人工智能发展轨迹走向社会积极结果的最有效方式。” Dario说。
 
然而,Daniela Amodei承认,用目前的方法很可能无法实现完全无偏见的人工智能。
 
她说:“我认为,几乎不可能创建一个完全中立的GenAI工具,这不仅是技术上的,也是因为甚至不是每个人都同意什么是中立的。”
 
Anthropic的战略的一部分是一种被称为符合宪法的人工智能的方法,在这种方法中,模型被调整以遵循“宪法”中定义的原则,但Dario Amodei承认,即使是这种技术也不是完美的。
 
“我们的目标是让模型做到公平,在意识形态和政治上保持中立,但你知道,我们还没有完全做到这一点,”他说,“我认为,你知道,没有人能完美地把握这一点。”
 
尽管如此,Dario认为,与Gemini面临的指控相反,Anthropic的宪法中广泛认同的价值观有助于防止模特向任何党派议程倾斜。
 
“我们的目标不是宣传任何特定的政治或意识形态观点,”他说,“我们希望我们的模型适用于所有人。”
 
企业网D1net(www.d1net.com):
 
国内主流的to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营19个IT行业公众号(微信搜索D1net即可关注)。
 
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

关键字:AIAnthropicClaude3

原创文章 企业网D1Net

x Anthropic推出Claude 3,在基准测试中超过GPT-4和Gemini Ultra 扫一扫
分享本文到朋友圈
当前位置:人工智能行业动态 → 正文

Anthropic推出Claude 3,在基准测试中超过GPT-4和Gemini Ultra

责任编辑:cres 作者:Michael Nuñez |来源:企业网D1Net  2024-03-05 16:38:00 原创文章 企业网D1Net

Anthropic发布的Claude 3系列AI模型中的明星是Opus,Anthropic声称它比市场上任何其他公开可用的人工智能系统都更强大,甚至超过了竞争对手OpenAI和谷歌的模型。
 
Anthropic联合创始人兼首席执行官Dario Amodei在接受记者采访时表示:“Opus能够完成最广泛的任务,并非常出色地完成这些任务。”
 
Amodei解释说,Opus在一系列基准测试中表现优于GPT-4、GPT-3.5和Gemini Ultra等顶级人工智能模型,这包括在GSM-8K数学推理和MMLU专家级知识等学术基准方面位居榜首。
 
Amodei说:“它的表现似乎超过了所有人,在一些任务上获得了我们以前从未见过的分数。”
 
虽然Anthropic和谷歌等公司尚未披露其领先模型的完整参数,但这两家公司报告的基准结果表明,Opus在核心能力上与GPT-4和Gemini等主要替代模型不相上下,甚至超过了它们。
 
这至少在表面上为商业化的对话式人工智能建立了一个新的高水位。
 
Opus专为需要高级推理的复杂任务而设计,以其卓越的性能在Anthropic的产品阵容中脱颖而出。
 
提供中端、快速选项
 
中端模型Sonnet为企业提供了更具成本效益的日常数据分析和知识工作解决方案,保持了高性能,而没有旗舰模型的溢价标签。
 
与此同时,Haiku的设计是快速和经济的,适合面向消费者的聊天机器人等应用,在这些应用中,响应性和成本是关键因素。
 
Amodei告诉记者,他预计Haiku将在几周内公开推出,而不是几个月。
 
新的可视化功能开启了新的使用案例
 
新推出的每一种模型都支持图像输入,这是一项需求很大的功能,特别是对于图像中的文本识别等应用程序。
 
Anthropic总裁兼联合创始人Daniela Amodei告诉记者:“我们并没有把重点放在输出模式上,因为企业对输出模式的需求较少。”他强调,该公司的战略重点是最受企业欢迎的功能。
 
此外,Claude 3模型展示了与其他最先进模型一样的复杂计算机视觉能力,这种新模型开启了企业需要从图像、文档、图表和图表中提取信息的用例。
 
Daniela解释说:“很多客户数据要么是高度非结构化的,要么是某种可视化格式,仅仅是必须手动复制这些信息,才能让它与GenAI工具互动的过程就相当繁琐。”
 
法律服务、金融分析、物流和质量保证等领域可能受益于理解真实世界视觉和文本的人工智能系统。
 
走在人工智能偏见的钢丝上
 
在宣布这一消息之前,谷歌新推出的聊天机器人Gemini引发了争议,突显出科技公司在发布避免长期存在社会偏见的模型方面面临的困难。
 
上周,人们发现,促使Gemini生成历史图像导致的描述似乎夸大了种族描述,例如,要求提供北欧海盗或纳粹士兵的照片所产生的种族多元化群体的图像不太可能反映历史现实。
 
谷歌的回应是禁用了Gemini的图像生成能力,并发表了道歉声明,称其在努力增加多样性方面“没有击中目标”,然而,专家表示,这种情况说明了人工智能领域围绕偏见不断进行的平衡行动。
 
Dario Amodei在接受采访时强调了指导人工智能模型的难度,称其为一门“不精确的科学”,他说,该公司有专门的团队来评估和缓解他们的模型中的各种风险。
 
“我们的假设是,站在人工智能发展的前沿是引导人工智能发展轨迹走向社会积极结果的最有效方式。” Dario说。
 
然而,Daniela Amodei承认,用目前的方法很可能无法实现完全无偏见的人工智能。
 
她说:“我认为,几乎不可能创建一个完全中立的GenAI工具,这不仅是技术上的,也是因为甚至不是每个人都同意什么是中立的。”
 
Anthropic的战略的一部分是一种被称为符合宪法的人工智能的方法,在这种方法中,模型被调整以遵循“宪法”中定义的原则,但Dario Amodei承认,即使是这种技术也不是完美的。
 
“我们的目标是让模型做到公平,在意识形态和政治上保持中立,但你知道,我们还没有完全做到这一点,”他说,“我认为,你知道,没有人能完美地把握这一点。”
 
尽管如此,Dario认为,与Gemini面临的指控相反,Anthropic的宪法中广泛认同的价值观有助于防止模特向任何党派议程倾斜。
 
“我们的目标不是宣传任何特定的政治或意识形态观点,”他说,“我们希望我们的模型适用于所有人。”
 
企业网D1net(www.d1net.com):
 
国内主流的to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营19个IT行业公众号(微信搜索D1net即可关注)。
 
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

关键字:AIAnthropicClaude3

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^