近日,IBM宣布其深度学习技术取得了重大进展,可以将深度学习系统消化数据所需要的时间从数天缩短到数小时。
IBM Fellow Hillery Hunter(图片来自IBM)
据悉,IBM开发出了能够将这些任务分配到64台服务器的软件,这些服务器总共有256个处理器,可在速度方面取得巨大飞跃。凡是拥有IBM Power系统服务器的用户,以及其他想要测试的技术人员,均可获得这项技术。
IBM研究员和系统加速及记忆主管希拉里·亨特表示,这些改进可以帮助放射学家更快、更准确地找到病变部位,并读取大量医学图像。
据了解,IBM使用了64个自主开发的Power 8服务器,每一个都将通用的英特尔微处理器和英伟达图形处理器连接起来,并使用快速的NVLink连接,以促进两种芯片之间的数据流传输。
“将深度学习从一个带有8个处理器的服务器扩展到64个服务器,每个服务器有8个处理器,可以将性能提高50-60倍。”亨特说,“我们的想法是改变训练深度学习模式的速度,真正提高工作效率。”
IBM深度学习技术(图片来自IBM Research)
IBM的系统通过由加州大学伯克利分校创建的“咖啡因”深度学习框架,在256个处理器之间实现95%的扩展效率。之前的记录是由Facebook人工智能研究公司创造的,扩展效率达到89%。
图像识别方面,IBM系统再次使用了“咖啡因”框架,在7个小时内识别了750万张图片,准确率达到了33.8%。微软之前的记录是29.8%,而达到这一准确率花了10天。