OpenAI周四在System Card报告中推出OpenAI GPT-4.5的研究预览版,这是其迄今最大、知识最丰富的模型,现已向每月订阅费用200美元的ChatGPT Pro订阅用户开放。下周,该模型也将向每月20美元的ChatGPT Plus订阅用户开放。OpenAI首席执行官Altman表示,届时该公司将增加数万块GPU,提供算力支撑。OpenAI表示,在GPT-4o的基础上,GPT-4.5进一步扩展了预训练,并被设计成比其强大的stem推理模型更通用。早期测试表明,与GPT-4.5互动感觉更自然。它拥有更广泛的知识库,更符合用户意图,情商更高,因此非常适合写作、编程和解决实际问题等任务,而且幻觉更少。
黄仁勋:Blackwell需求惊人
英伟达CEO黄仁勋表示,对Blackwell的需求是惊人的,因为推理人工智能增加了另一条扩展定律——增加训练计算使模型更智能,增加长期思考计算使答案更智能。英伟达已经成功地大规模生产了Blackwell人工智能超级计算机,在其首个季度实现了数十亿美元的销售额。
DeepSeek开源三项优化并行策略,梁文锋参与研发
DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水线并行算法,这种算法能够完全重叠前向和后向计算通信阶段,与传统方法相比减少了“流水线气泡”(设备在某些时刻的空闲等待)。在DualPipe的开发团队署名中,包括创始人梁文锋。
知情人士称谷歌在云计算部门裁员,或仅影响少数团队
知情人士称,谷歌在云计算部门裁掉部分员工,尚不清楚裁员规模。据悉,本轮裁员仅影响少数团队。谷歌发言人在一份声明中表示,公司将继续做出调整,以“满足客户需求和适应未来重大机遇”。
Figure机器人进厂打工,成物流分拣大师!
Figure公司几天前才发布了第一款自研视觉-语言-动作(VLA)模型Helix,统一了感知、语言理解和学习控制,他们又在一个全新场景中实现了机器人应用的落地——物流包裹操作和分拣,而且,只用了短短30天。
我国牵头制定,养老机器人国际标准正式发布
近日,国际电工委员会(IEC)正式发布由我国牵头制定的养老机器人国际标准(IEC 63310《互联家庭环境下使用的主动辅助生活机器人性能准则》),该项标准依据老年人生理和行为特点,为各类养老机器人的产品设计、制造、测试和认证等提供基准,将引领全球养老机器人产业健康发展。