微软年度科技展TechFest 2013于上周在美国西雅图市的雷德蒙正式开幕,微软全球各地研究院的数百名顶级科研人员参加了此次科技展,并给大家展示了多项最新研究成果。在本次科技展上,微软与用户分享了一些尚处于研发初期的项目与高科技产品。让我们一起来看看这些又酷又炫的技术与项目,相信一定会让你发现微软绝不是要老去的软件巨头。
用体感创造想象中的虚拟形象
这是来自于微软亚洲研究院的参展技术。BodyAvatar作为一个自然的界面,可以让Kinect玩家将自己的肢体作为输入手段,发挥他们的想象,创造出任何形态的3D虚拟形象。基于“你即是虚拟形象”的理念,玩家只需将身体姿态扫描成初始的形状,然后通过各种直观的手势直接在自己身体上操作,即可修改屏幕上虚拟形象的形态。BodyAvatar释放出每个人的创造力,让人们无需掌握任何复杂的3D建模工具,就能把自己最狂野的想象变成现实。
SketchInsight交互白板系统
本项目由微软雷德蒙研究院送展,项目使用和扩展了白板动画的叙事性讲故事属性,并结合交互式信息可视化技术,创建了一种全新且引人入胜的用数据来讲故事的形式。
SketchInsight是一种交互式白板系统,通过实时草图用数据讲故事。有助于快速、轻松地创建个性化并且富有表现力的数据图表。用户勾勒出一个样本图标,SketchInsight就能通过样本草图的合成来自动完成图表。并且,SketchInsight还能让人与数据图表之间进行互动。本项目使用和扩展了白板动画的叙事性,且结合交互式信息可视化技术,创建了一种全新且引人入胜的用数据来讲故事的形式。
微软雷德蒙研究院部分其它项目:
实时业务元数据提取:本项目提出,通过真实用户的签到行为对实时业务元数据进行众包。用户每次进入一个商家,本项目就会通过手机上的麦克风和先进的信号处理来推断商家的上客率、正在播放的歌曲、音乐和噪音的音量水平等。被提取的元数据既可以作为商业信息显示在搜索结果中,也可以经过索引而实现更进一步的查询功能,例如“播放嘻哈音乐的拥挤酒吧”。本项目通过多个设备上录制的真实商家音频痕迹,推断实时业务元数据的准确度达到80%以上。
面部互动:这个项目从我们内在的感知和超语言沟通这个角度出发,体现出互动和沟通的意义。我们将面部表情和头部姿态看作有意义的指标,将它们映射到了许多相互关联的听觉、触觉和视觉反应上。这个项目还旨在提供一个平台,用于研究信息检索和沟通所需的各种传感技术。例如,将音乐节拍投射到人们关节的震动上,将成为帮助有听力障碍的人学习跳舞的自然方法之一。其他用途包括将注视、笑声、眨眼或音调高低映射到音频、视频和振动信号上,以营造人与人之间的亲密感。
SandDance:SandDance是一个基于Web的可视化系统,集自然用户界面、大数据和可视化于一身。它利用3D硬件加速来探索成百上千件物体之间的关系。任意数据表都可以被加载,而结果也可以用facets标签进行过滤,并以各种布局加以显示。本项目也支持包括多点触控和手势交互在内的自然用户交互技术。
3D模型构图软件Kinect Fusion
微软剑桥研究院的产品。Kinect Fusion通过一台手持Kinect for Windows摄像头实现3D模型的高质量扫描和重建。该项目利用C + +加速大规模并行性,实现了对各种图形硬件的支持。
该项目是一种全新的实时3D场景捕获和重建方法,使用多种鲜艳的色彩和深度图像,对可见表面进行高分辨率的体素化。本项目能够捕捉动态场景中的几何体,如行走中与交谈中的人们等。这种方法的关键在于一种高效、稀疏的体素显像,非常适用于GPU加速。本项目可以综合利用深度、轮廓和颜色等因素,从融合后的图像数据中捕获和处理超高分辨率体素化。
教会Kinect读懂你的手势
同样是来自微软剑桥研究院的技术。当用户使用手写笔或手指在屏幕上触控时,该系统将弹出一个菜单为用户提供不同的功能性选择。用户也可以根据自身需要扩大其所弹出的菜单内容,只需通过两个手指的拉伸动作即可达成。该项目通过捕捉大量不同的人手图像集,利用机器学习技术来训练Kinect准确地辨别你的手处于张开或握紧的状态。这样,我们就可以研制出手掌/拳头检测器,其作用相当于鼠标点击的手势版。这款检测器将用于即将发布的Windows版Kinect中,并将在自然用户交互应用领域引发一轮新浪潮。
微软剑桥研究院部分其它项目或技术:
提高数据发掘和分析效率的工具:本项目为不是十分精通Excel的用户提供了快速、简便地发掘和分析数据的工具。在数据发掘方面,本项目支持从网页中提取结构性数据,对人物建立索引,帮助信息工作者对其进行搜索。信息工作者可以直接在Excel中进行搜索,轻松地将数据导入到电子表格中,并与已有数据进行整合。在数据分析方面,本项目展示了无缝整合到Excel中的一系列机器学习工具,能够自动推断缺失单元格的数值,发现例外,使得用户能够更有效地分析数据表格。
运行速度堪比思维的地理数据库应用:这款SQL Server 2012应用帮助参观者对全球生物多样性、保护区和威胁数据库进行实时查询。这款新软件力图让任何人都能“以思维的速度”轻松构建此类地理数据应用,而无需编写任何代码。该软件本身就能理解空间数据和空间搜索,由此引入了一个新的迭代搜索方法。并且生成的数据库也状态灵活,在任何时间都可以对数据库及其应用进行修改。
病毒化内容的识别和SandDance可视化
来自于微软纽约研究院的项目。本项目找出了一种社会媒体病毒化的量化理念,也识别出了成千上万的病毒事件。本项目可以让用户以交互方式探索流行内容的扩散结构。例如,当选定一篇报道后,用户可以查看随时间推移的视频,表明该报道是如何从一个用户传播到下一个,从而识别出这个过程中哪些用户具有重大影响力,并查看扩散级联中任何一条路径上的tweets链条。本项目背后所包含的科学和技术可以帮助识别话题专家、发现热门话题,并针对各种内容提供病毒化指标。
用于实时流媒体的自适应机器学习
自适应机器学习项目融合了高效的时间流处理技术与对机器学习的支持,展示了如何将时间处理和使用Infer.NET(机器学习的数据库文件)机器学习技术编入到一个在StreamInsight中运行的推理流中,以及如何在运行时对机器学习模型提供增量在线更新。同时,本项目也展示了如何在在线流处理和离线数据分析之间进行转换,以及如何在生产系统中使用一个有效的离线推理流。这项工作将给制造和云/ IT服务领域的具体客户使用场景带来附加价值。
人群增强型网络教育视频
微软印度研究院送展的项目。VidWiki作为一个在线平台,可以利用在线观看视频演示的广大学生来反复改善它们的质量和内容,在这一点上类似于维基百科等其他信息众包项目。通过这个平台,用户将自己的注释叠加到原来的视频内容上,减轻了教师更新和完善内容的负担。分层注释也有助于视频索引、语言翻译,并将潦草字迹或图表替换成可读性更强的印刷字体内容。
用教育视频对教材进行强化
来自于微软硅谷研究院的项目。本项目运用基于数据挖掘的方法来改善教科书的质量。这种方法包含一种诊断工具,供作者和教育工作者借助算法语言识别教科书中的缺陷。利用这些技术,我们可以通过指向特定网页内容的链接,借助算法语言对一本书的特定章节进行强化。其重点在于利用指向相关视频内容的链接对教材的章节进行强化,而这些视频内容则是从网上丰富、免费、高品质的教育视频中挖掘出来的。这项技术已经被跨越不同科目和年级的高中教科书语料库加以验证。
最后,这次科技展不仅将架起基础研究与产品工程实际转化之间的桥梁,更是与微软与全球用户分享它们对未来科技发展趋势美好愿景的优秀平台。