Siri随着iPhone 4S的发布而引发整个科技行业的齐声惊叹,无数人被Siri Hold住了,对着iPhone 4S说“I Love You”的果粉不计其数。从目前获知的信息来看,Siri的出现不仅仅是手机产品的飞跃,也将成为人机交互史、人工智能史上的又一次革命。
iPhone 4S Siri智能语音系统值得期待
对于普通消费者而言,Siri仅仅是手机上和我们不断打招呼的语音程序而已,其实在Siri的背后还是大有文章的,那个在后台高速运作、含情脉脉回答你问题的计算机服务器系统更值得研究。首先可以肯定的是,Siri的运算并不全部在本机上完成,还有很大一部分工作会在苹果宣称的“数据中心”进行,也就是说Siri必须在Wifi/3G环境下才能工作,通过网络连接到后端的数据中心进行检索有用的信息。而在前不久,Siri的服务器便因为用户进行测试过多,引发了苹果服务器不堪负荷,系统宕机的情况。
IBM沃森机器人
提起人工智能项目,就不能不提由IBM和美国德克萨斯大学联合研制的超级电脑“沃森”(Watson)。在全球目光的注视下,沃森在美国最受欢迎的智力竞猜电视节目《危险边缘》中击败该节目历史上两位最成功的选手肯-詹宁斯和布拉德-鲁特,站在巅峰。而回顾整个电视节目过程,相比沃森的睿智而言,笔者对沃森幽默风趣的语言更是感受到无比的震撼,这正是和Siri的异曲同工之处:依靠强大的服务器网络进行服务,语音只不过是其简单的一个组成部分而已,也是我们能够最直观接触的一个方面。所不同的是,IBM的沃森更多的是停留在实验室为少数人所知的项目,而苹果Siri却已经正是宣布为广大普通消费者提供应用服务。
沃森”(Watson)语音团队
经过科技的进步,当前的语音技术远非简单的语音识别那么简单,通过网络互联、数据库计算等方面的全盘加入,已经成为了全新的智能化系统。下面,笔者便和大家探讨一下苹果Siri智能语音系统技术的前世今生,当前智能语音技术的幕后科技力量,以及未来能够给我们的生活所带来的改变,希望能够对大家有所帮助。
提到Siri,我们先来了解其历史。
从技术渊源来看,Siri始于史上最大的人工智能项目:五角大楼的CALO项目(“Cognitive Assistant that Learns and Organizes”的缩写,中文意思为:会学习和组织的认知助理),而此计划带头人Adam Cheyer现在也已经结盟苹果,任职iPhone团队的工程总监。该计划主要是为军方提供智能化服务,Siri只不过是从中衍生出来的民用部分分支。
苹果Siri始于美国国防部的人工智能项目
不过Siri项目被很多人看好,包括在Morgenthaler Ventures、李嘉诚基金会和SRI International等投资方在其发展的前两年持续投入了2380万美元来帮助这个仅有25位员工的小公司。当Siri在苹果官方商店上发布相关应用程序不久,乔布斯敏锐察觉到了此应用的前景,迅速以2亿美元的价格收购了Siri公司,其应用程序也从苹果在线商店中消失。等再次回到公众视野中,Siri已经伴随着iphone 4S的发布引发人们的阵阵欢呼。
和人们所熟悉的Android系统的Voice Actions、Windows7所使用的语音系统仅仅有语音识别、理解、发音几方面而言,Siri最大的不同便是通过网络链接到苹果后方强大的服务器,提供的完全的数据检索、词义解析等服务,而不仅仅停留在以往简单的语音识别方面。说白了,我们不应用用语音系统来定义Siri,其更像一个具有人工智能的私人秘书。显而易见,Siri和沃森等一样应该归于人工智能项目,而非语音项目。

采用IBM Power750服务器的“沃森”(“Watson”)
在前文中我们提到Siri必须在有网络的情况下才能运行,便是因为其需要连接后端的数据中心来寻找答案。IBM沃森在人机大战中轻松战胜两位出色的人类选手,同样依靠后端的服务器。所不同的是,苹果的数据中心是一对多服务,所以Siri服务均需连接至此。而沃森则是一对一服务,本身并不对外进行网络连接,数据检索完全依靠本身自带的庞大数据库来完成。
那么,沃森的背后是什么呢?在和人进行智力对决的时候,要求其在在3秒内处理海量并发任务和数据的同时实时分析信息――检索大约2亿页的内容(约一百万册书籍的价值),分析数以百万计的信息碎片,并且根据它寻找到的证据提供最佳答案。“沃森”计算系统是由IBM Power 750服务器组成的10机架计算群,运行LINUX操作系统,RAM为15兆字节。 该系统的每个节点都装有四架POWER 7芯片,每芯片均为8核4线程。因此沃森的每个节点都包含128线程,相当于128台电脑。这就意味着沃森包含了2880个Power 处理器内核,运行速度高达80万亿浮点。
当然,进行人工智能语音系统研发并且成功推出产品的并非只有苹果和IBM两家公司,包括谷歌、微软等公司也在积极的进行此方面的研发工作。在其中的语音识别方面,我们所熟悉的李开复博士便是专家,其博士论文便是世界上第一个“非特定人连续语音识别系统”,并且开发出了手机的语音拨号功能,其在苹果公司担任的便是语音组的经理。当然,我们也希望看到更多的人工智能项目应用,而并非仅仅停留在语音识别方便。>>
下面,我们来了解一下Siri的背后的数据中心。
在Siri的背后,是苹果公司强大的数据中心iDataCenter。不过话说回来,苹果在数据库、服务器等企业级市场一直处于弱势地位,前不久苹果公司刚刚宣布放弃Xserve机架服务器产品线。苹果的保密工作做的非常出色,iDataCenter内部鲜有人知道细节。不过笔者经过在国内外多放搜集,还是了解到了一部分信息:苹果的数据中心系统环境包括该公司的MacOSX系统,IBM公司的AIX,Linux系统和Sun公司的Solaris系统,新的iDataCenter将成为苹果云计算战略的核心部分。

苹果放弃Xserve机架服务器产品线
iDataCenter将有一个“大重点”在高效率上,包括IBM专门针对高效技术HACMP的“HAGEO解决方案”,Veritas集群服务器和Oracle的DataGuard,另外还有Real应用集群。据苹果公司透露,目前已经有三座iCloud数据中心了,一座位于加州的纽瓦克;另外,今年四月,苹果签署了一项2.28万千瓦电力负荷的新数据中心七年的租赁合同,位于加利福尼亚州圣克拉拉市。圣克拉拉数据中心将为苹果提供在美国西海岸的额外装机容量。
苹果数据中心
而iDataCenter是目前苹果规模最大的数据中心,其特点在于采用了平板地板和冷却系统,冷空气直接进入架空的设备。苹果还采用了独立的散热系统,从排气到送风单独控制,这样可以显著改善数据中心冷却效率。乔布斯还曾经展示了一个大型数据仓库Teradata设备的图片,其利用了固态硬盘加速数据传输。苹果似乎也使用HPProLiant服务器与NetApp存储设备。
苹果云计算服务iCloud背后也指望强大的数据中心
编辑点评
通过服务器系统的介绍,相信读者也了解到了只有背后强大的数据中心做支撑,Siri才能如此智能,Siri是我们所能看到的前端服务而已。当然,由Siri引导的这次人机交互革命并非只有苹果公司一家在唱独角戏,IBM的沃森如果网络集群化发展是完全有实力达到甚至超越苹果Siri的。在未来,我们将会看到谷歌、微软等品牌的语音控制技术将会往人工智能方向迈大步前进。
Siri,仅仅是一个开始,好戏才刚刚上演!