时下,“AI”、“芯片”、“AI芯片”不仅是世界范围的“网红”词,同样还代表着继互联网时代之后的全新时代。因为AI的概念、解决方案逐渐成熟,人们的生活也随之得到了巨大的改变——目前AI已用于医疗、安防、自动驾驶、消费类电子等越来越多的落地应用场景。
说起AI就不得不说撑起整个AI世界的基石、智能生活背后的巨人——AI芯片。自2018年伊始,芯片的产业价值和战略地位日益突出,尤其“人工智能”被冠以国家发展战略的崇高定义后,整个人工智能产业对AI芯片的热情瞬间达到沸点,无论是传统芯片厂商还是BAT互联网巨头,无论是老牌企业还是初创公司,均积极布局投身人工智能产业。
作为人工智能产业链的关键环节和硬件基础,AI芯片有着极高的技术研发和创新壁垒,而当前对人工智能芯片的定义并没有一个公认的标准。比较通用的看法是能够运行深度学习算法的芯片都可以称为“AI芯片”,但实际上高标准要求下的AI芯片在能效比上有着数量级的差别。
目前,虽然经过多年的积累、耕耘,已经在语音识别、机器视觉方面取得了不俗的成绩,但归根结底还是依托于冯诺依曼架构。具体表现为通过不断迭代、优化计算部分的资源来提升效能,具有代表性的有:
第一代AI芯片——DSP/GPU:
通常DSP/GPU再包装上一些软件层写好的库,可以提供给用户一个包装好的AI芯片运行环境。这样的解决方案是可以满足深度学习产生海量数据并行运算的需求,其效率超过CPU,但其运行深度学习算法能效又远低于ASIC及FPGA,直接表现就是效率、成本和功耗都很差。
第二代AI芯片——基于卷积或矩阵计算设计的专用芯片:
通过硬件平台,运行深度神经网络算法,可以得到较高的效率,同时又可有效控制成本,但存储墙问题严重制约了此类芯片的发展、应用。
为了解决存储墙问题,行业开始酝酿第三代AI芯片,比如采用分布式片上存储、存储计算一体化,这样的做法看起来似乎是解决了部分存储墙问题,但这样做的结果还存在太多的不确定性和很高的成本,更类似实验室产品。
到这,关于AI芯片的迭代好像打了个死结。实际,行业内早就有了意见——法国研究机构CEA-Leti认为,为快速成长的人工智能应用实现高效率的运算性能,必须解决“存储墙”(memory wall)的瓶颈,并推动新的架构解决方案。
推动新的架构解决方案,那么新的架构应具备什么样的特点呢?回头看看现有的架构解决方案,答案呼之欲出:计算驱动存储,既表现为用较为富裕的计算资源驱动较为稀缺的存储资源,其适用于计算复杂度高,存储复杂度低的环境,并不适用于深度学习。
实际上,北京探境科技有限公司于近日发布了一个巅峰性的AI芯片架构——“存储优先架构”(SFA架构)。该架构推翻了传统冯诺依曼结构,利用存储为中心来设计芯片架构,充分解决了存储墙的问题,具备能效比高,DDR带宽占用率低的特点,与其它AI芯片解决方案相比,资源利用率有成倍的增长。按照此前的逻辑,这个AI芯片架构可以称其为全新的第四代AI芯片了。
经了解,这家成立时间不长的AI芯片公司,研发人员占比达到了恐怖的85%,核心成员都拥有15年以上的行业资历,他们带领团队分别奋斗在芯片设计、系统设计、软件、算法等领域,是一家名副其实的以科技创新为核心竞争力的公司。
据介绍,探境科技旗下采用SFA架构的两款芯片即将商用,他们分别是语音芯片和图像芯片,而芯片的具体性能远超目前的行业标准。
究其原因,因为SFA架构不仅解决了前三代AI芯片的短板,同时还具备诸多特点:
以存储资源为中心,通过存储带动计算来设计存储和计算通道。数据在存储之间的搬移过程之中就完成计算,计算对于数据来说只是一种“演变”
存储、计算、调度算法一体化,通过软硬件协同工作,控制器在存储和计算节点进行最优的映射。
可以支持未来的可计算SRAM或其他新型存储,进一步提高计算效能。
对于非平衡的通用计算,可以通过计算层附着的不同算子加以支持。SFA架构可以支持高差异化的计算类型,并且不同的计算范式互不干扰。
天然支持高并发的计算,也从根本上解决了高并发引起的带宽问题。
另外值得一提的是,在一年的时间里,探境科技完成了两轮共计数千万美元的融资,这对初创型公司来说,实属少见。同时,公司目前掌握数十项发明、软件著作权,这也从侧面印证了探境科技的研发实力。
目前来看,探境科技和他的SFA(存储优先架构)给亟待实现技术突破的AI芯片行业打开了一扇新的大门,对推动人工智能行业发展起到了积极的作用,但其最终的落地应用效果如何,让我们等待市场的检验。
最后,我们也希望有更多的国产AI芯片企业能推陈出新,让生活变得更加智能、简单。