OpenAI CEO奥特曼当地时间7月20日发文称,到今年年底,将有超过100万个GPU上线,为这个团队感到骄傲,但他们最好开始想办法把这个数字提高至100倍。
英伟达推出OpenReasoning-Nemotron推理模型
7月20日,英伟达推出了全新推理模型套件OpenReasoning-Nemotron,该套件包含四个基于Qwen-2.5微调的模型,参数规模分别为1.5B、7B、14B 和32B,全部源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的GPU与云计算成本。
上海发布算力监测调度平台
上海市7月18日正式发布算力监测调度平台。据介绍,该平台将实现上海市算力资源统一监测、算力资源智能调度运营能力,以推动算力的集约化、一体化和协同化发展。该平台已与中国算力平台(上海)实现互联互通,标志着在上海乃至长三角区域内形成“算力+数据+行业场景”的协同联动态势。
中国联通发布全球最长距离大模型异构混训成果
在2025中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于7月19日正式发布了全球最长距离大模型异构混训试验成果。通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置,联合团队完成了超1500公里跨域的千亿参数AI大模型异构混训试验,经验证等效算力可达单芯片单集群等效算力的95%以上。
总投资50亿元!立讯机器人总部基地项目在常熟开工
7月19日,立讯机器人总部基地项目开工仪式在常熟举行,项目总投资50亿元,计划今年年底竣工投产,达产后可实现年产值100亿元。据悉,此次开工的立讯机器人总部基地选址常熟智算未来城,占地面积66亩,规划建设14.5万平方米定制化产业及研发设施,用于工业自动化成套装备、各类机器人及核心零部件的研发、制造、销售。
回应撤离中国市场原因,Manus首度披露技术侧经验教训
Manus近期撤出中国市场,全力转战海外市场,官方解释原因主要基于经营效率的调整及国际化布局。7月19日,Manus联合创始人季逸超发布技术博客,首度从技术角度做出回应,总结创业以来在Agent研发与训练方面的经验教训。单从技术层面来看,季逸超表示Manus会侧重押注上下文(Context)工程,借助构造“记忆”与流程实现产品快速迭代。主要包括押注上下文、不再训练模型,强调KV-Cache(Key-Value Cache,一种缓存机制)命中率意义,不动态添加工具,以及用文件系统承载持久上下文等方面。核心即节省底层模型训练成本,侧重训练效率的提高。