当前位置:云计算行业动态 → 正文

D1net阅闻:全球最大开源大模型!马斯克正式开源Grok AI

责任编辑:cres |来源:企业网D1Net  2024-03-18 10:05:39 原创文章 企业网D1Net

全球最大开源大模型!马斯克正式开源Grok AI
 
马斯克的初创公司xAI信守诺言,将其首个大型语言模型Grok开源。马斯克此前曾宣布,开源Grok的举措将于本周实施。现在,任何其他企业家、程序员、公司或个人都可以体验和测试Grok——模型的人工神经元或软件模块之间的连接强度,这些模块使模型能够做出决策、接受输入并以文本形式提供输出——以及其他相关文档,并将模型的副本用于任何他们想要的东西,包括商业应用。该公司在一篇博客文章中宣布:“我们正在发布我们的大型语言模型Grok-1的基本模型和网络架构,Grok-1是xAI从头开始训练的3140亿参数混合专家模型。”
 
知情人士:马斯克的SpaceX公司正在为美国情报机构建立一个间谍卫星网络
 
据五名知情人士透露,SpaceX公司正在与美国情报机构签订一份机密合同,建立一个由数百颗间谍卫星组成的网络,这表明埃隆·马斯克(Elon Musk)的太空公司与国家安全机构之间的关系正在加深。消息人士称,该网络由SpaceX的星盾业务部门根据2021年与管理间谍卫星的情报机构国家侦察局(NRO)签署的18亿美元合同建造。
 
ChatGPT参数规模被扒:只有7B
 
南加州大学最新研究,ChatGPT参数规模很可能只有7B(70亿)。南加大团队三位作者破解出了未公布的gpt-3.5-turbo嵌入向量维度(embedding size)为4096或4608。而几乎所有已知的开源大模型如Llama和Mistral,嵌入向量维度4096的时候都是约7B参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。因此南加大团队指出,可以推测gpt-3.5-turbo的参数规模也在7B左右,除非是MoE架构可能不同。数月前,曾有微软CODEFUSION论文意外泄露当时GPT-3.5模型参数为20B,在后续论文版本中又删除了这一信息。

全面转向生成式AI!苹果推出300亿参数多模态大模型
 
相较于英伟达、微软等大型科技股,苹果今年的表现令人失望不已,股价年内跌逾10%,且失去了“全球市值最高公司”的宝座。背后原因很简单,苹果在这场人工智能(AI)竞赛中落伍了。为了摆脱窘境,苹果近期放弃了造车项目,正在全面转向生成式AI领域,并且很快有了新动作。就在近日,苹果公司研发团队发布了一篇论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,首次公布了多模态大模型MM1,展示了该公司在AI方面的进展与实力。据悉,MM1最高参数量为300亿,该模型支持增强的上下文学习和多图像推理,在一些多模态基准测试中有较好表现。
 
国家数据局:加快构建全国一体化算力网 推动建设中国式现代化数字基座
 
国家数据局党组书记、局长刘烈宏在《求是》发表署名文章称,大道至简,实干为要。当前,数字化、智能化发展动力澎湃,为我国以高质量发展全面推进中国式现代化提供了难得的历史机遇。我们要深入贯彻全国一体化大数据中心体系建设的战略部署,坚持问题导向、目标导向,以钉钉子精神抓工作落实,从产业生态、算力供给、网络传输、调度运营、技术创新等多维度发力,构建联网调度、普惠易用、绿色安全的全国一体化算力网,加快实现算力基础设施化,以算力经济高质量发展更好服务国家数据事业发展全局,推动建设中国式现代化数字基座。
 
奔驰汽车工厂试点 Apollo 机器人:从事搬运、装配等繁重体力活
 
德国车企梅赛德斯-奔驰(Mercedes-Benz)和通用仿人机器人开发商 Apptronik 宣布达成协议,双方将合作探索高科技机器人 Apollo,主要从事搬运、装配零部件等繁重的低技能劳动。Apollo 仿人机器人高 173 厘米,重 73 千克,能举起重达 25 千克的重物,定位是在工业环境中辅助员工。根据双方协议,奔驰将启动试点项目,在汽车制造过程中,测试 Apptronik 公司的 Apollo 仿人机器人执行各种任务的能力,例如向生产线运送组装套件、检查零部件等等。
 
国家发改委:加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设
 
国家发展改革委发布促进国家级新区高质量建设行动计划。支持新区优化重点产业布局。有序推进智能制造和数字化转型。加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,上海浦东新区带动赋能千家企业数字化转型,天津滨海新区打造一批典型应用场景。研究支持在有条件的新区所在地方布局建设未来产业先导区。依托设在新区的中小企业数字化转型试点和新区承担的建设国家算力枢纽节点等重要任务,实施智能制造重大项目,布局一批工业互联网平台。
 
深圳:新增建设5G基站3000个以上 边缘计算中心15个
 
日前,深圳发布了《深圳市极速宽带先锋城市2024年行动计划》,该计划致力于到2024年底,初步构建出泛在先进、高速智能、天地一体的新型信息基础设施体系,确保网络供给能力和服务水平达到全球顶尖水准,从而打造出世界领先、模式创新的极速宽带先锋城市。其中,推动5G-A技术的引领发展被列为首要任务。计划提出,将新增超过3000个5G基站,并升级支持超过5000个5G-A基站。此外,还将在低空经济、智慧交通等关键领域试点应用10个以上的5G-A融合项目。按照“城市+园区+边缘”的总体布局,全市计划新增3万个标准机架,并规划布局10个园区配套数据中心。同时,还将建设15个边缘计算中心,旨在打造“城市内1毫秒,到韶关枢纽节点3毫秒,到贵安枢纽节点10毫秒”的超低时延圈,为城市的数字化转型和智能化升级提供坚实的信息通信基础。

关键字:ChatGPTAI人工智能

原创文章 企业网D1Net

x D1net阅闻:全球最大开源大模型!马斯克正式开源Grok AI 扫一扫
分享本文到朋友圈
当前位置:云计算行业动态 → 正文

D1net阅闻:全球最大开源大模型!马斯克正式开源Grok AI

责任编辑:cres |来源:企业网D1Net  2024-03-18 10:05:39 原创文章 企业网D1Net

全球最大开源大模型!马斯克正式开源Grok AI
 
马斯克的初创公司xAI信守诺言,将其首个大型语言模型Grok开源。马斯克此前曾宣布,开源Grok的举措将于本周实施。现在,任何其他企业家、程序员、公司或个人都可以体验和测试Grok——模型的人工神经元或软件模块之间的连接强度,这些模块使模型能够做出决策、接受输入并以文本形式提供输出——以及其他相关文档,并将模型的副本用于任何他们想要的东西,包括商业应用。该公司在一篇博客文章中宣布:“我们正在发布我们的大型语言模型Grok-1的基本模型和网络架构,Grok-1是xAI从头开始训练的3140亿参数混合专家模型。”
 
知情人士:马斯克的SpaceX公司正在为美国情报机构建立一个间谍卫星网络
 
据五名知情人士透露,SpaceX公司正在与美国情报机构签订一份机密合同,建立一个由数百颗间谍卫星组成的网络,这表明埃隆·马斯克(Elon Musk)的太空公司与国家安全机构之间的关系正在加深。消息人士称,该网络由SpaceX的星盾业务部门根据2021年与管理间谍卫星的情报机构国家侦察局(NRO)签署的18亿美元合同建造。
 
ChatGPT参数规模被扒:只有7B
 
南加州大学最新研究,ChatGPT参数规模很可能只有7B(70亿)。南加大团队三位作者破解出了未公布的gpt-3.5-turbo嵌入向量维度(embedding size)为4096或4608。而几乎所有已知的开源大模型如Llama和Mistral,嵌入向量维度4096的时候都是约7B参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。因此南加大团队指出,可以推测gpt-3.5-turbo的参数规模也在7B左右,除非是MoE架构可能不同。数月前,曾有微软CODEFUSION论文意外泄露当时GPT-3.5模型参数为20B,在后续论文版本中又删除了这一信息。

全面转向生成式AI!苹果推出300亿参数多模态大模型
 
相较于英伟达、微软等大型科技股,苹果今年的表现令人失望不已,股价年内跌逾10%,且失去了“全球市值最高公司”的宝座。背后原因很简单,苹果在这场人工智能(AI)竞赛中落伍了。为了摆脱窘境,苹果近期放弃了造车项目,正在全面转向生成式AI领域,并且很快有了新动作。就在近日,苹果公司研发团队发布了一篇论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,首次公布了多模态大模型MM1,展示了该公司在AI方面的进展与实力。据悉,MM1最高参数量为300亿,该模型支持增强的上下文学习和多图像推理,在一些多模态基准测试中有较好表现。
 
国家数据局:加快构建全国一体化算力网 推动建设中国式现代化数字基座
 
国家数据局党组书记、局长刘烈宏在《求是》发表署名文章称,大道至简,实干为要。当前,数字化、智能化发展动力澎湃,为我国以高质量发展全面推进中国式现代化提供了难得的历史机遇。我们要深入贯彻全国一体化大数据中心体系建设的战略部署,坚持问题导向、目标导向,以钉钉子精神抓工作落实,从产业生态、算力供给、网络传输、调度运营、技术创新等多维度发力,构建联网调度、普惠易用、绿色安全的全国一体化算力网,加快实现算力基础设施化,以算力经济高质量发展更好服务国家数据事业发展全局,推动建设中国式现代化数字基座。
 
奔驰汽车工厂试点 Apollo 机器人:从事搬运、装配等繁重体力活
 
德国车企梅赛德斯-奔驰(Mercedes-Benz)和通用仿人机器人开发商 Apptronik 宣布达成协议,双方将合作探索高科技机器人 Apollo,主要从事搬运、装配零部件等繁重的低技能劳动。Apollo 仿人机器人高 173 厘米,重 73 千克,能举起重达 25 千克的重物,定位是在工业环境中辅助员工。根据双方协议,奔驰将启动试点项目,在汽车制造过程中,测试 Apptronik 公司的 Apollo 仿人机器人执行各种任务的能力,例如向生产线运送组装套件、检查零部件等等。
 
国家发改委:加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设
 
国家发展改革委发布促进国家级新区高质量建设行动计划。支持新区优化重点产业布局。有序推进智能制造和数字化转型。加快设在新区的国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,上海浦东新区带动赋能千家企业数字化转型,天津滨海新区打造一批典型应用场景。研究支持在有条件的新区所在地方布局建设未来产业先导区。依托设在新区的中小企业数字化转型试点和新区承担的建设国家算力枢纽节点等重要任务,实施智能制造重大项目,布局一批工业互联网平台。
 
深圳:新增建设5G基站3000个以上 边缘计算中心15个
 
日前,深圳发布了《深圳市极速宽带先锋城市2024年行动计划》,该计划致力于到2024年底,初步构建出泛在先进、高速智能、天地一体的新型信息基础设施体系,确保网络供给能力和服务水平达到全球顶尖水准,从而打造出世界领先、模式创新的极速宽带先锋城市。其中,推动5G-A技术的引领发展被列为首要任务。计划提出,将新增超过3000个5G基站,并升级支持超过5000个5G-A基站。此外,还将在低空经济、智慧交通等关键领域试点应用10个以上的5G-A融合项目。按照“城市+园区+边缘”的总体布局,全市计划新增3万个标准机架,并规划布局10个园区配套数据中心。同时,还将建设15个边缘计算中心,旨在打造“城市内1毫秒,到韶关枢纽节点3毫秒,到贵安枢纽节点10毫秒”的超低时延圈,为城市的数字化转型和智能化升级提供坚实的信息通信基础。

关键字:ChatGPTAI人工智能

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^