2月26日上午消息,DeepSeek开源周(OpenSourceWeek)第三日,在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek再次宣布开放了DeepGEMM代码库。据DeepSeek方面介绍,DeepGEMM是专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计,它同时支持普通的和专家混合(MoE)分组的GEMM运算。该库使用CUDA编写,在安装过程中无需编译,通过在运行时使用轻量级即时编译模块来编译所有内核。
Anthropic推出首款混合推理模型Claude 3.7 Sonnet
人工智能初创公司Anthropic宣布推出Claude 3.7 Sonnet,称这是迄今为止最智能的模型,也是市场上首款混合推理模型。该公司介绍,Claude 3.7 Sonnet既能提供接近即时的响应,也能展示分步骤的详细思考过程。API用户还可对模型的思考时长进行精细化控制。此外,同步推出的Claude Code命令行工具(研究预览版),使开发者可直接通过终端将重要工程任务委托给Claude完成。
波士顿动力创始人:已购买宇树机器人 DeepSeek创新只是个开始
波士顿动力创始人Marc Raibert当地时间2月24日在美国休斯顿参加达索系统3DEXPERIENCE World峰会期间接受采访时称,他的智能机器人研究所AI Institute已经购买了中国机器人创业公司宇树科技的机器人,以测试它的能力。“我们的实验室买了宇树的人形机器人,还买了几个小型的机器人,它们相对便宜。”Raibert表示,“即便我们是竞争对手,我们也可以买来看看它究竟能做些什么。”Raibert特别提及这一轮由DeepSeek引发的中国人工智能创新热潮。
上海市委书记:深入实施集成电路、生物医药、人工智能三大先导产业新一轮“上海方案”
上海市委中心组2月25日下午举行学习会,上海市委书记陈吉宁主持会议。陈吉宁指出,要统筹当前长远,加快转型升级。大力培育新质生产力,深入实施集成电路、生物医药、人工智能三大先导产业新一轮“上海方案”。 深化工业降本增效,加大对企业数智改造和绿色低碳转型的支持力度。
英特尔接收的首批两台阿斯麦尖端光刻机已投产
据报道,英特尔表示,来自阿斯麦(ASML)的首批两台尖端光刻机已在其工厂“投入生产”,初步数据表明其可靠性优于更早的机型。在加利福尼亚州圣何塞举行的会议上,英特尔高级首席工程师史蒂夫·卡森表示,公司使用阿斯麦的高数值孔径(NA)光刻机,在一个季度内已生产3万片晶圆(这些大型硅盘可产出数千枚计算芯片)。
豆包正小范围测试深度思考模型,但接入模型非DeepSeek
字节跳动旗下AI助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。据豆包相关负责人表示,当前测试的是自己深度思考模型的不同实验版本。记者实测发现,在豆包对话页面暂未显示“深度思考”功能的入口,但被灰度到的用户在询问不同问题后,豆包生成的答复中会显示思维链。
全球首个人形机器人自主站立控制技术取得新突破
近期由上海人工智能实验室、上海交通大学等机构共同发布的一项算法技术,能够使人形机器人从各种状态下实现快速、稳定地站立。上海人工智能实验室青年科学家庞江淼说,我们应该是全球第一个完成在可泛化地形、任意地形能够站起来的算法。之前的这些工作基本是在固定的地形、固定的姿态,以固定的程序让一个机器人站起来,但是我们是通过从交互中学习的技术,能够让它非常直接地在不同的场景、地形、姿势下直接站起来。