当前位置:云计算行业动态 → 正文

D1net阅闻:维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4

责任编辑:cres |来源:企业网D1Net  2024-01-04 09:52:00 原创文章 企业网D1Net

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%
 
大模型固有的幻觉问题严重影响了LLM的表现。近日,来自斯坦福的研究人员用维基百科数据训练大模型,发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!目前已Github上开源了代码。作者表示自己的最佳模型在新的基准测试中获得了97.3%的事实准确性,而相比之下,GPT-4的得分仅为66.1%。此外,作者将基于GPT-4的WikiChat提炼成7B参数的LLaMA,这个模型在事实准确性方面仍然能拿到91.1%的高分,并且运行速度提高了6.5倍,能效更好,可以本地部署。
 
消息称英伟达正开发“Skinny Joe”AI GPU:700W TDP,特供中国
 
根据国外科技媒体tweaktown报道,英伟达正开发名为“Skinny Joe”的全新 AI GPU,预估为中国特供版本,其 TDP 为 700W。根据曝光的参考Dev_ID列表,“Skinny Joe”仅次于新款L20 AI GPU和英伟达GeForce RTX 4090 D显卡。目前尚不清楚“Skinny Joe” AI GPU的具体规格信息,不过预估可能是H100或者H200的“瘦身”版本。
 
国家数据局:围绕数据基础设施总体布局 开展全国一体化算力网示范工程建设
 
《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》日前发布,国家数据局主要负责同志表示,近期将重点推进四方面工作:一是强化顶层统筹。依托新型基础设施建设推进协调机制,国家发展改革委、国家数据局会同中央网信办、工业和信息化部、国家能源局加强统筹推进力度,协调解决建设过程中存在的问题。二是完善政策体系。针对关键问题开展专项研究,完善算力券、数据中心REITs等政策工具设计,强化政策性金融工具支持力度。三是推行示范工程。围绕数据基础设施总体布局,开展全国一体化算力网示范工程建设。四是加强评估督导。成立工作专班,持续开展政策落地跟踪,建立常态化算力统计监测机制。
 
DRAM内存涨势汹汹!三星、美光酝酿提价15%-20%
 
据中国台湾电子时报报道,存储器模块业者传出,三星电子、美光等存储器大厂,正规划今年第一季将DRAM价格调涨15%-20%,从1月起执行,借此催促客户提前规划未来使用需求量。已有厂商透露收到三星的涨价预告。业界人士称,上游原厂涨价焦点将从NAND转移至DRAM,DDR4、DDR5有望成下一波调涨重点,以加速改善营运亏损。至于DDR3,其产能及需求相对稳定,预计涨幅相对平缓。
 
科技部发文规范AI使用 禁用AIGC直接生成申报材料
 
科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。 《指引》适用对象包括科研机构、高等学校、医疗卫生机构、企业及其科研人员,有关规范要求覆盖科技活动的主要环节和过程。针对成果发布问题,《指引》强调,公布突破性研究成果和重大研究进展应经所在科研单位同意。未经科学验证或同行评议的研究成果,科研人员不得向公众传播;不得将已发表的论文或其中的数据、图片等再次发表,不得将多篇已发表论文各取一部分拼凑出“新成果”后发表。
 
SpaceX将发射首批6颗直连手机卫星
 
SpaceX公司在X平台上的官方账号当地时间1月2日晚间发帖称,将首次发射6颗具有直连手机能力的星链卫星,这将进一步促进全球连接并帮助消除死区。马斯克转发了这条帖子,并写道:“这将允许移动电话连接到地球上的任何地方。注意,每个波束只能支持~7Mb,而且波束非常大。所以虽然对于没有蜂窝连接的地区来说,这是一个很好的解决方案,但它与现有的地面蜂窝网络没有明显的竞争力。”

关键字:AI大模型GPT算力

原创文章 企业网D1Net

x D1net阅闻:维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4 扫一扫
分享本文到朋友圈
当前位置:云计算行业动态 → 正文

D1net阅闻:维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4

责任编辑:cres |来源:企业网D1Net  2024-01-04 09:52:00 原创文章 企业网D1Net

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%
 
大模型固有的幻觉问题严重影响了LLM的表现。近日,来自斯坦福的研究人员用维基百科数据训练大模型,发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!目前已Github上开源了代码。作者表示自己的最佳模型在新的基准测试中获得了97.3%的事实准确性,而相比之下,GPT-4的得分仅为66.1%。此外,作者将基于GPT-4的WikiChat提炼成7B参数的LLaMA,这个模型在事实准确性方面仍然能拿到91.1%的高分,并且运行速度提高了6.5倍,能效更好,可以本地部署。
 
消息称英伟达正开发“Skinny Joe”AI GPU:700W TDP,特供中国
 
根据国外科技媒体tweaktown报道,英伟达正开发名为“Skinny Joe”的全新 AI GPU,预估为中国特供版本,其 TDP 为 700W。根据曝光的参考Dev_ID列表,“Skinny Joe”仅次于新款L20 AI GPU和英伟达GeForce RTX 4090 D显卡。目前尚不清楚“Skinny Joe” AI GPU的具体规格信息,不过预估可能是H100或者H200的“瘦身”版本。
 
国家数据局:围绕数据基础设施总体布局 开展全国一体化算力网示范工程建设
 
《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》日前发布,国家数据局主要负责同志表示,近期将重点推进四方面工作:一是强化顶层统筹。依托新型基础设施建设推进协调机制,国家发展改革委、国家数据局会同中央网信办、工业和信息化部、国家能源局加强统筹推进力度,协调解决建设过程中存在的问题。二是完善政策体系。针对关键问题开展专项研究,完善算力券、数据中心REITs等政策工具设计,强化政策性金融工具支持力度。三是推行示范工程。围绕数据基础设施总体布局,开展全国一体化算力网示范工程建设。四是加强评估督导。成立工作专班,持续开展政策落地跟踪,建立常态化算力统计监测机制。
 
DRAM内存涨势汹汹!三星、美光酝酿提价15%-20%
 
据中国台湾电子时报报道,存储器模块业者传出,三星电子、美光等存储器大厂,正规划今年第一季将DRAM价格调涨15%-20%,从1月起执行,借此催促客户提前规划未来使用需求量。已有厂商透露收到三星的涨价预告。业界人士称,上游原厂涨价焦点将从NAND转移至DRAM,DDR4、DDR5有望成下一波调涨重点,以加速改善营运亏损。至于DDR3,其产能及需求相对稳定,预计涨幅相对平缓。
 
科技部发文规范AI使用 禁用AIGC直接生成申报材料
 
科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。 《指引》适用对象包括科研机构、高等学校、医疗卫生机构、企业及其科研人员,有关规范要求覆盖科技活动的主要环节和过程。针对成果发布问题,《指引》强调,公布突破性研究成果和重大研究进展应经所在科研单位同意。未经科学验证或同行评议的研究成果,科研人员不得向公众传播;不得将已发表的论文或其中的数据、图片等再次发表,不得将多篇已发表论文各取一部分拼凑出“新成果”后发表。
 
SpaceX将发射首批6颗直连手机卫星
 
SpaceX公司在X平台上的官方账号当地时间1月2日晚间发帖称,将首次发射6颗具有直连手机能力的星链卫星,这将进一步促进全球连接并帮助消除死区。马斯克转发了这条帖子,并写道:“这将允许移动电话连接到地球上的任何地方。注意,每个波束只能支持~7Mb,而且波束非常大。所以虽然对于没有蜂窝连接的地区来说,这是一个很好的解决方案,但它与现有的地面蜂窝网络没有明显的竞争力。”

关键字:AI大模型GPT算力

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^