当前位置:统一通信/协作企业动态 → 正文

微软的实时翻译,或许它还只是个孩子

责任编辑:editor006 作者:钟舒婷 |来源:企业网D1Net  2015-05-17 21:21:58 本文摘自:好奇心日报

总之和你看到的演示视频不太一样

前两天,微软Skype Translator进行公开试用,Windows 8.1和Windows10内测用户不需要申请就可以在应用商店下载试用。

于是在办公室,我们找到了两台运行 Windows 8.1系统的电脑,并装上Skype Translator预览版进行测试(Windows 10测试版下载后无法打开,一直在转圈圈)。

然而,从最终的结果看来,Skype Translator的实时翻译没有演示视频那么令人惊艳,效果也远远没达到我们的预期。但Skype将语音识别、文字翻译和语音合成三个步骤进行压缩所达到的“实时”效果,对跨语言沟通意义非凡,微软在产品的打磨上仍然需要时间,毕竟这还牵涉到机器学习的问题。

在应用商店安装、打开应用后,通话对象的头像下面会有一个翻译的按钮,打开后便可以设置双方的语言。

在进行语音/视频对话时,翻译文本会实时呈现在右侧的对话框内,然后语音播放,就和同声传译一样。此外,Skype Translator会把整个对话内容记录下来,用于机器学习以不断提高语音识别和文本翻译的质量。

首先我们使用了新概念教材朗读、雷军媒体见面的录音进行测试,由于Skype Translator对一大段话的识别效果太差,后来我们采取了播一句,按一次暂停的办法。准确性的结果如下(括号内为最终翻译出来的英文):

雷军采访:雷军:排得太长的了呢,我们团队都疏导了,就说你们还是在网上买。

Skype:还在网上买(Buy it on the Internet.)

雷军:那么在小米网预约的人呢也超过了100万人。

Skype:超过了1000000.(More than 1000000.)

雷军:所以呢我觉得作为顶配的首发第一站来看的话,我觉得这个结果超出我想象。

Skype:我觉得作为.(I think, as.)

其实我们也试了Are you OK?但完全没法识别。

新概念:

新概念:Did the detective saved the diamond?

Skype: To look at this problem(给看我这只笔问题)

新概念:The plane was late, and the detective were waiting at the airport all morning.

Skype:Call caofeidian game called my friends(打给曹妃甸赛打给我的网友)

新概念:A few hours earlier, someone had told the police that the thieves were try to steal the diamond.

Skype: Phone card shopping mall(手机卡商场)

从目前的翻译结果来看,Skype Translator语音识别的准确性不稳定。我和同事的日常对话也很难正常记录,基本上语速稍快就会丢字。

即便是识别率较高的中文,也会闹出一些笑话,例如在我与另一位作者的日常对话中,“不在办公室”,却识别成了“我在办公室”,所以一字一句地发音,识别的准确性就会显著提高,截图最后一句话充分表达了我的心情——几乎是崩溃的,:)。

假如你两种语言夹杂着用,它依然会按照之前设置的“使用语言”进行识别,即使你说的是中文,它也会以为你讲的是英语,识别结果自然大相径庭。

经过各种测试之后,我们得出Skype Translator预览版的大致效果如下:

短句子>长句子

环境安静>环境嘈杂

中文识别>英文识别

文本对话>视频语音对话

尽管测试结果不是特别让人满意,但毕竟它还只是个预览版。Google说现在的语音识别准确性已经可以达到92%,所以测试中出现的语音识别问题从技术上来说问题不大,而且相比普遍配有两三个麦克风过滤噪音的智能手机,电脑的效果也差得多。也许我们可以期待一下移动版的效果。

但即便解决了识别,以今天Bing翻译、Google翻译的水平,谈笑风生怕是也有点难。

关键字:Skype微软文本对话

本文摘自:好奇心日报

x 微软的实时翻译,或许它还只是个孩子 扫一扫
分享本文到朋友圈
当前位置:统一通信/协作企业动态 → 正文

微软的实时翻译,或许它还只是个孩子

责任编辑:editor006 作者:钟舒婷 |来源:企业网D1Net  2015-05-17 21:21:58 本文摘自:好奇心日报

总之和你看到的演示视频不太一样

前两天,微软Skype Translator进行公开试用,Windows 8.1和Windows10内测用户不需要申请就可以在应用商店下载试用。

于是在办公室,我们找到了两台运行 Windows 8.1系统的电脑,并装上Skype Translator预览版进行测试(Windows 10测试版下载后无法打开,一直在转圈圈)。

然而,从最终的结果看来,Skype Translator的实时翻译没有演示视频那么令人惊艳,效果也远远没达到我们的预期。但Skype将语音识别、文字翻译和语音合成三个步骤进行压缩所达到的“实时”效果,对跨语言沟通意义非凡,微软在产品的打磨上仍然需要时间,毕竟这还牵涉到机器学习的问题。

在应用商店安装、打开应用后,通话对象的头像下面会有一个翻译的按钮,打开后便可以设置双方的语言。

在进行语音/视频对话时,翻译文本会实时呈现在右侧的对话框内,然后语音播放,就和同声传译一样。此外,Skype Translator会把整个对话内容记录下来,用于机器学习以不断提高语音识别和文本翻译的质量。

首先我们使用了新概念教材朗读、雷军媒体见面的录音进行测试,由于Skype Translator对一大段话的识别效果太差,后来我们采取了播一句,按一次暂停的办法。准确性的结果如下(括号内为最终翻译出来的英文):

雷军采访:雷军:排得太长的了呢,我们团队都疏导了,就说你们还是在网上买。

Skype:还在网上买(Buy it on the Internet.)

雷军:那么在小米网预约的人呢也超过了100万人。

Skype:超过了1000000.(More than 1000000.)

雷军:所以呢我觉得作为顶配的首发第一站来看的话,我觉得这个结果超出我想象。

Skype:我觉得作为.(I think, as.)

其实我们也试了Are you OK?但完全没法识别。

新概念:

新概念:Did the detective saved the diamond?

Skype: To look at this problem(给看我这只笔问题)

新概念:The plane was late, and the detective were waiting at the airport all morning.

Skype:Call caofeidian game called my friends(打给曹妃甸赛打给我的网友)

新概念:A few hours earlier, someone had told the police that the thieves were try to steal the diamond.

Skype: Phone card shopping mall(手机卡商场)

从目前的翻译结果来看,Skype Translator语音识别的准确性不稳定。我和同事的日常对话也很难正常记录,基本上语速稍快就会丢字。

即便是识别率较高的中文,也会闹出一些笑话,例如在我与另一位作者的日常对话中,“不在办公室”,却识别成了“我在办公室”,所以一字一句地发音,识别的准确性就会显著提高,截图最后一句话充分表达了我的心情——几乎是崩溃的,:)。

假如你两种语言夹杂着用,它依然会按照之前设置的“使用语言”进行识别,即使你说的是中文,它也会以为你讲的是英语,识别结果自然大相径庭。

经过各种测试之后,我们得出Skype Translator预览版的大致效果如下:

短句子>长句子

环境安静>环境嘈杂

中文识别>英文识别

文本对话>视频语音对话

尽管测试结果不是特别让人满意,但毕竟它还只是个预览版。Google说现在的语音识别准确性已经可以达到92%,所以测试中出现的语音识别问题从技术上来说问题不大,而且相比普遍配有两三个麦克风过滤噪音的智能手机,电脑的效果也差得多。也许我们可以期待一下移动版的效果。

但即便解决了识别,以今天Bing翻译、Google翻译的水平,谈笑风生怕是也有点难。

关键字:Skype微软文本对话

本文摘自:好奇心日报

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^