GPU加速助力深度学习发展 NVIDIA准备好了

责任编辑：editor005 作者：唐琼瑶 |来源：企业网D1Net 2015-05-08 14:03:30 本文摘自：TechTarget中国

在IT界，永远不缺乏新鲜的词汇与炫酷的技术。深度学习(Deep Learning)就是其中之一，近些年获得无数关注与追捧。Facebook、Google、百度、腾讯与阿里巴巴等互联网巨头都开始尝试将深度学习算法运用到产品开发中，包括计算机视觉、文本检索、语音识别以及自然语言理解等，以便让产品更智能化，更好地提升用户体验。

深度学习为什么那么火爆?传统的机器学习面临诸多挑战，目前最大的网络仅仅10层左右，拥有10亿个参数，那么用1000万张图片进行训练需要30百亿亿次浮点运算，而人脑拥有数以万亿计的参数，是前者的1000倍。所以，人眼与电脑所见大不相同。

因此，深度学习是目前最接近人脑的智能学习方法，它通过建立深度神经网络像人脑一样去学习知识。而深层模型的并行化框架和训练加速方法是深度学习走向实用的重要基石。

GPU加速对于深度学习的重要意义

GPU自身具备的高并行度、矩阵预算与强大的浮点计算能力与深度神经网络的需求契合，可以大幅加速深度学习模型的训练，在相同精度下能提供更快的处理速度、更少的服务器投入以及更低的功耗。

NVIDIA(英伟达)中国区技术经理赖俊杰作了一个比喻，深度学习就像一个待发射的火箭，需要引擎与燃料这两大要素才能起飞。“引擎指的是大型神经网络，而燃料就是数据。”

GPU加速在其中所起的作用是训练一个卷积神经网络。例如，批处理128images，CPU需要124秒，而GPU只需要14.5秒。

NVIDIA的深度学习战略

GPU简直就是NVIDIA公司的镇店之宝。它是现代视觉计算的引擎，从最初用于游戏娱乐与视觉计算，到现在广泛应用于HPC、云与大数据领域，GPU的魅力正在散发光芒。NVIDIA全球副总裁、PSG兼云计算业务中国区总经理Ashok Pandey表示，NVIDIA已经形成完整的端到端解决方案平台，业务横跨HPC与数据中心，覆盖石油石化、高教、政府、超算、金融与消费终端等领域。

从2008年的Tesla、2010年的Fermi，到2012年的Kepler，再到2014年的Maxwell。NVIDIA Tesla GPU加速器在HPC与超算行业中发挥着重大作用。其强大的性能与更大的内存容量，企业用户可以快速地处理大数据分析应用所产生的海量数据。对计算科学家来说，Tesla加速器可提供所需的处理动力，能够以前所未有的速度运行更大型的模拟。

Ashok表示，NVIDIA将在中国构建完整的生态系统圈。具体而言，主要覆盖六大方面，包括积极参与开发社区，针对最流行的深度学习框架，如Caffe、Theano、Torch，推出基于这些框架的CUDA工具库;与众多高校科研机构合作，构建30余所CUDA联合创新中心和研究中心;与BAT等互联网企业合作，打造强大的OEM体系;启动针对深度学习相关新兴公司的研讨会培训计划，召开ICCML与ACML等大会;吸引诸如科大讯飞与北京文安等初创企业加入其中;以及与政府、基金资助机构合作。

整个体系如何分工协作呢?首先是OEM合作伙伴提供硬件，主要是由曙光与浪潮等小伙伴提供，例如浪潮此前推出了一款基于GPU的SmartRack，这款GPU协处理加速整机柜服务器为深度学习提供支撑。NVIDIA则提供语音、文字、图像、人脸识别、开发平台与Cuda等软件，对新兴公司进行技术培训，实现ISV与SP的应用开发，针对重点客户则合作建立联合实验室满足其特殊需求。

2015年1月，NVIDIA与爱奇艺签署了深度合作框架协议双方将在视频深度学习和媒体云计算领域紧密合作，利用最先进的GPU和深度学习架构，搭建爱奇艺视频创作、分享、服务平台。

四大新品你必知

刚刚在美国结束的由NVIDIA主办的全球GPU领域规模最大的GPU技术大会(GTC 2015)上，深度学习成为最耀眼的明星。

NVIDIA发布了全球最快的GPU——GeForce GTX TITAN X。在图像分类模型AlexNet的训练中，只需不到3天时间便可完成，比基于16核CPU的系统快15倍。而NVIDIA的下一代GPU架构Pascal，更可将深度学习加速10倍。

此外，还有针对研究人员的深度学习平台DIGITS DevBox、在深度学习方面相当于Maxwell十倍的Pascal，以及用于自动驾驶汽车的深度学习平台Nvidia Drive PX。

应用广泛的CUDA并行计算架构也针对深度学习推出了cuDNN函数库。cuDNN可以直接集成到目前流行的深度学习框架中，例如Caffe、Torch7和Theano等，开发人员可以快速无缝在系统中整合GPU。通过cuDNN，开发人员不必再关心以往深度学习系统中的底层优化，他们可以将注意力集中在更高级的机器学习问题。

赖俊杰表示，基于Cudnn的Caffe训练AlexNet模型时，性能比原始版本提升1.36倍，卷积计算达到1.9倍，Pooling达到2.7倍。他表示，很多用户选择Caffe作为深度学习的框架。

深度学习NVIDIA准备好了

GPU加速器不仅在高性能计算与超级计算行业中已成主流，而且深度学习与人工智能也是GPU发光发热的领域。作为GPU市场当之无愧的王者，NVIDIA凭借其自身的优势将在深度学习方面大展拳脚。正如Ashok所强调的，NVIDIA是一家技术型的公司，可以为深度学习研究提供完整的技术平台和解决方案。企业则可以使用GPU代替CPU以获得更高的速度及更低的成本。

关键字：GPU 学习算法学习平台