2017人工智能与机器学习年终盘点（重要工具资源汇总）

责任编辑：editor005

作者：王萌

2018-01-07 19:41:39

摘自：IT经理网

2017年是人工智能技术全面开火、勇猛精进的一年，也是对未来全球科技和经济影响深远的一年。深度学习与增强学习资源汇总　　随着深度学习和增强学习的流行，相关的演讲、培训和课程资源越来越丰富，以下是部分精华资源传送：

2017年是人工智能技术全面开火、勇猛精进的一年，也是对未来全球科技和经济影响深远的一年。

无论人工智能圈子内外的从业者，都开始正视这个可能会很快改变所有人命运的热门技术。关注、学习、思考、实践人工智能技术及其相关应用，将是所有IT人未来多年将要面对的最重要的课题和命题。以下IT经理网根据WildML的报告，将2017年“万物并作”的人工智能和机器学习领域的重大进度节点和资源工具梳理如下：

完全不依赖人类知识经验的AlphaGo Zero击败人类，这比2016年AlphaGo击败李世石更加让人震惊

AlphaGo Zero的算法技术基于这篇已经发布的论文——《深度学习与树搜索的快思与慢思》，当时间来到2017年底，AlphaGo Zero的通用算法版本AlphaZero问世，这个算法突破了围棋领域的局限，砍瓜切菜般拿下了国际象棋、将棋等人类棋盘游戏的至尊宝座。至此，AlphaZero一统所有棋盘游戏江湖，成为水平远超人类的“棋神”。

AlphaGo Zero完成对AlphaGo Master的超越，以及避开人类经验干扰后产生的大量创新招法（参见谷歌发布的AlphaGo Zero围棋教学工具）已经完全突破了人类数千年总结的基本围棋规律和哲理，这意味着当面对极为复杂的计算难题（例如围棋、生物医药、环境、交通、软件开发等）时，人类的“宝贵”经验和大数据最终有可能成为一种“负资产”，或者用专业一点的术语说，是“脏数据”、对抗性样本，反而会阻碍机器突破人类智慧的天花板。

当人工智能开发的软件bug更少，效率更高、疾病误诊率更低、股票交易成绩更好、药品研发成本更低时，我们大量的知识工人可能面对一个可怕的未来，不是驾驭人工智能，而是被人工智能彻底淘汰。

其实不仅仅是AlphaGo，2017年还有很多人工智能算法也取得了令人瞩目的成就，首先是捷克科技大学、阿尔伯塔大学、查尔斯大学等联合研发的DeepStack首次击败了人类职业扑克选手，随后卡梅隆大学研发的人工智能算法Libratus（Science论文），在不完全信息的无限制一对一德州扑克比赛中击败了人类顶尖选手。

2018年，人工智能技术有望在多人游戏，例如扑克和星际争霸中战胜人类，DeepMind已经发布了针对星际争霸2的人工智能技术研究环境，OpenAI则演示了在一对一的Dota 2游戏中战胜人类的算法，并且计划不久的未来在5v5的多人对战游戏中也取得胜利。

进化式算法（Evolution Algorithms）东山再起

Photo：Wired

对于监督式学习来说，使用反向传播算法的渐进式方法效果向来不错，未来短时间也不可能有太大变化。但是在增强学习中，进化策略（Evolution Strategies）却有东山再起的趋势。因为数据往往不是独立分布，或者错误信号较为稀疏，或者还有较大探索空间，算法通常不需要渐进式方法也能取得显著进步。另外，进化式算法可以线性扩展到数千台服务器来支持超快并行培训，计算不依赖昂贵的GPU，大量的廉价CPU就可以。

今年早些时候，OpenAI展示了进化策略能够取得与Deep Q-Learning这样的标准增强学习算法相当的成绩，时至年底，Uber的一个团队发表了一篇博客以及五篇研究论文，展示了Genetic算法的创新研究成果，一个极简化的Genetic算法，不借助任何渐进信息，可以学会较为复杂的Atari游戏，在Frostbite（冻伤）这个游戏中，Genetic算法打出了10500分，而一些顶尖人类玩家的得分不到1000。

技术流变：WaveNets、卷积神经网络（CNNs）与注意机制（Attention Mechanisms）

谷歌公司的Tacotron 2文本到语音系统生成的极为自然的机器声音样本让人印象深刻，该算法基于自回归模型——WaveNet，在过去一年中，该模型也在谷歌助理中使用并在高保真语音合成方面取得显著进步。此前WaveNet在机器翻译也得到应用并大大加快了培训速度，提高了回归架构的效率。

在机器学习这个子领域，放弃昂贵且需要较长培训时间的回归架构已经成为大势所趋，在Attention is all you Need一文中，研究者完全放弃了回归和卷积架构，使用一个更佳复杂的注意机制（Attention Mechanisms），能以低的多的成本，取得极为出色的机器翻译成绩。

深度学习框架群雄并起

图片：wired

回顾2017年的人工智能市场，深度学习框架绝对是主角，Facebook推出的重量级框架PyTorch擅长处理动态图谱架构，类似Chainer，赢得了自然语言处理专家们的喜爱，因为他们经常需要处理动态回归架构，谷歌的静态图谱框架Tensorflow在这方面有些捉襟见肘。

但是，TensorFlow依然是2017年的框架之王，二月份谷歌发布了稳定的Tensorflow1.0版本，目前其版本已经迭代到1.4.1，除了主体框架外，谷歌还发布了一系列Tensorflow的伴侣程序库，包括面向动态计算机图形的Tensorflow Fold、面向数据输入管线的Tensorflow Transform，以及DeepMind的高级Sonnet库。值得注意的是，Tensorfow团队还发布了一个eager execution执行模式，可以以类似PyTorch的方式处理动态计算机图形。

除了Google和Facebook两大巨头外，很多公司也跳上了机器学习框架的花车：

苹果发布了CoreML移动机器学习库

Uber团队发布了Pyro，一个深度概率编程语言

亚马逊发布了Gluon，一个MXNet高级API。

Uber公布了内部机器学习基础设施平台“米开朗基罗”的技术细节。

除了通用深度学习框架，还涌现了大量增强学习框架，例如：

OpenAI Roboschool一个机器人模拟的开源框架
OpenAI Baselines 一组高质量的增强学习算法实现用例
Tensorflow Agents 包含了为使用Tensorflow训练RL代理优化的基础架构
Unity ML Agents 可供研究者和开发者使用Unity 编辑器开发游戏和模拟器，然后用增强学习训练。
Nervana Coach 顶级增强学习算法的实验平台
Facebook’s ELF Facebook的游戏研发平台
DeepMind Pycolab 一个可定制化的gridworld游戏引擎
Geek.ai MAgent一个支持多代理的增强学习研究平台

为了进一步推广深度学习，还出现了一些面向web的深度学习框架，例如谷歌的Deeplearn.js以及MIL WebDNN。但百花齐放也有未老先衰的，例如此前非常流行的框架Theano就停更了。

深度学习与增强学习资源汇总