人类与计算机之间的竞争一直都深受关注。1996年,IBM超级电脑“深蓝”和世界冠军卡斯帕罗夫的那场国际象棋比赛至今仍被人津津乐道。
15年后,人机大战又再度上演:2月14日至2月16日,经过为期三天的激战, IBM新一代超级电脑沃森(watson)最终在美国最受欢迎的智力竞猜节目《危险边缘》(Jeopardy)中,战胜了该节目史上最出色的两名人类冠军选手。为此,本刊特意整理相关资料,回答几个读者可能最关心的问题。
1.沃森怎么这么强大?
沃森正是IBM所说的“负载优化”系统。其硬件由10个机柜总共90台Power 750服务器组成,每台POWER 750服务器配备四路八核32线程3.5GHz处理器,内存15TB,数据库采用DB2,操作系统为SUSE Linux Enterprise Server,是一个总共拥有2880个POWER7核心的集群系统。
沃森的存储平台采用的是IBM公司2010年推出的集群NAS系统SONAS。SONAS可以从1个存储节点扩展至30个,最大裸容量可达14.4PB。不过,此次为沃森配置的SONAS由48块SATA盘组成,每块SATA盘容量450G,因此总容量为21.6TB。由于采用的是RAID1配置,所以沃森的SONAS实际所存储的原始数据是10.8TB,其中还有3TB的数据用于操作系统和应用程序。
强大的并行计算能力只是沃森获胜的关键之一,另一个关键则是算法。沃森是基于IBM“DeepQA”(深度开放域问答系统工程)技术开发的。作为沃森超级电脑基础的DeepQA技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。IBM研发团队为沃森开发的100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成答案输出成人类语言。每一种算法都有其专门的功能。其中一种算法被称为“嵌套分解”算法,它可以将线索分解成两个不同的搜索功能。
例如,竞赛中有一道问题是:“通缉罪犯,最近一次在巴拉多塔(Tower of Barad-Dur)出现,这是一只巨眼,伙计们,你们会找到它的。”无论是沃森还是人要通过这些碎片信息找到答案。具体而言,沃森首先要通过巴拉多塔找到《魔戒》这部作品,其次,沃森要将眼睛和罪恶联系起来,在魔戒中找到相应的角色。巴拉多塔出现在魔戒中,罪恶的巨眼因此是索伦之眼,答案是索伦。当然,沃森答对了这道题。
不过,沃森也“出过糗”,例如过错把加拿大的多伦多当作是美国城市。IBM表示将会继续分析沃森为在竞赛中答错的那些问题,从而完善算法。
值得一提的是,当年IBM为深蓝专门定制了组件,而构成沃森的组件市面都有销售。
2.沃森与深蓝的区别是什么?
相比深蓝系统,IBM中国研究院专家潘越在接受国内媒体采访时表示“最大的差异在于要面对的挑战和应对的算法方面。”
潘越解释说:“国际象棋定义明确,主要涉及数学,电脑可以轻易表示每一个游戏状态及相应步骤。《危险边缘》则要求电脑必须理解人类自然语言。与国际象棋不一样,人类语言完全是开放式的,往往模棱两可,需要上下文才能理解意思。虽然我们可以轻松理解人类语言,但开发理解人类语言的电脑系统却极具挑战性。”
因此,在沃森的设计中,自然语言理解是其中的核心问题。特别是如何更快地利用已有的各种非结构化和结构化的知识来帮助自然语言的理解——因为本次沃森挑战的《危险边缘》是智力问答竞赛,要求电脑必须理解人类自然语言。
“这中间又涉及到机器学习、大规模并行计算、语义处理等领域,沃森了不起的地方在于把这些技术整合在一个体系架构里,来应对自然语言理解的巨大挑战。”潘越说。值得一提的是,IBM中国研究院先后有六位专家也参与了沃森的开发。
3.沃森比谷歌聪明吗?
人机大战一开始,沃森与谷歌搜索引擎相比究竟谁更智能。对于,美国《商业周刊》前科技编辑史蒂芬-贝克尔的看法是:沃森比谷歌更智能。
贝克尔认为,答案很简单,谷歌现在还不能回答问题。谷歌只是提供一个查询结果列表,将人类引导到与所查询的答案相类似的答案上去,最终的判断权仍然是人类来决定。沃森则是自己处理所有问题。它必须要解码复杂的英语,穷尽所有可能的答案,并选择其中一个,最终判定它是否足够符合要求。不过,随着科技发展,未来谷歌等搜索引擎很有可能像沃森一样拥有精确回答问题的能力。
4.沃森真比人类聪明吗?
科学研究显示,人脑可容纳1.25TB的数据,大约相当于一个具有100万亿次浮点运算能力的系统。因此,IBM高级顾问兼发明家Tony Pearson认为,从某种程度上而言,具有80万亿次浮点运算能力的沃森,其能力已经达到人脑的80%。
特别是,尽管10.8TB的数据每次都会自动加载到沃森高达15TB的内存系统中,但实际只有约1TB的数据用来回答问题。Pearson说:“沃森比深蓝更象人类。像我们一样,他只用了他海量存储中的一小部分来回答问题。”
还有些人担心这是否意味着超级电脑将很快超越人类智慧,潘越表示,目前超级电脑只是在某些特定领域表现出和人类可比的智力水平,有更多的领域还差的远。潘越还表示,目前沃森使用了机器学习的技术,已经具有一定的学习能力,不过这个学习还是有指导的,完全的自学习能力还有待进一步研究和开发。
5.沃森的“就业前景”如何?
没错,沃森将会首先成为一名医生。
美国哥伦比亚大学医疗中心和马里兰大学医学院已与IBM公司签订合同,两所大学的医疗人员将利用“沃森”更快、更准确地诊病、治病。马里兰大学医学院教授艾略特说:“当病人特别多的时候,医生来不及把病人的所有信息一一录入计算机进行检索,这时沃森就能派上用场。它的海量信息库中存有许多发表在期刊上的专业论文,可以让医生利用最新科研成果治疗病人。”
近日,IBM又宣布将与Nuance Communications公司合作,将语音识别功能引入到医生助手服务中,“可能只需要18个月就可以推出这项服务了”。
当然,除了医疗系统之外,超级电脑在金融、电子、能源与电力等多个行业领域将有所应用。