借助Google DeepMind分支创建的新的语音合成系统WaveNet,Google Assistant将听起来更加自然。

WaveNet与传统的连续式TTS(语音合成)不同,传统的连续式TTS使用单个语音演员大量的预录制语音,而参量式TTS使用计算机生成的语音,可以使用每秒16,000个样本创建单个波形。
WaveNet使用了大量的语音样本数据,已经训练超过12个月来识别哪些音调相互依存,以及什么波形是真实的。
WaveNet将暂时使用在美国英语和日语中,但之后可能会运用到其它语言中,点击此链接(需梯子)可以收听使用WaveNet前后的谷歌Assistant声音区别。