要闻分享| 关注中国| 逆耳忠言| 不平则鸣| 情感天空| 健康生活| 流行时尚| 保险理财| 讽刺幽默| IT与游戏| 信息交流| 华发移民| 华发工作| 摄影美图

社会聚焦| 旅游天地| 娱乐八卦| 音乐视频| 校友互动| 网络社区| 房屋安家| 教育培训| 中医瑰宝| 专栏作者| 科技文化| 华发留学| 华发红娘| 关于本站

华发网China168.info海外中文门户网站

 找回密码
 立即注册

扫一扫,访问微社区

查看: 640|回复: 0

继创造AlphaGo之后 谷歌DeepMind让机器人的声音更像人

[复制链接]
发表于 2016-9-11 02:47:51 | 显示全部楼层 |阅读模式

继创造AlphaGo之后 谷歌DeepMind让机器人的声音更像人

继创造AlphaGo之后 谷歌DeepMind让机器人的声音更像人


  谷歌下属Deepmind宣布在计算机合成语音上迈出了重要的一步。据FT报道,DeepMind发布的最新研究成果WaveNet使得计算机生成的语音与人类声音间的差异缩小了一半。

  Deepmind 在其博客中写到“让人类和机器对话是人机交互领域长久以来的梦想”。

  彭博报道,在英文和中文进行的盲测中,听者普遍认为,相比谷歌任何现存的运用不同科技手段的文字-语音转换程序,WaveNet生成的语音都更加自然。

  据公司相关人员透露,WaveNet还没被应用到谷歌任何产品中。该系统需要强大的计算能力来合成语音,所以近期之内应该不会被用到“现实场景”中去。

  DeepMind是一家专注于人工智能的公司,于2010年成立于伦敦,并在2014年被谷歌以4亿英镑(约合5.32亿美元)收购。

  WaveNet所采用的技术和现存人工声音合成器有根本性的不同。WaveNet通过的是实际产生的声波而非语言本身,将文本转换成声音。该系统通过神经网络来模拟人脑,直接用音频的原始波形建模。这背后来自每秒高达16000个样本波形的强大数据库的支持。此外,每一个样本都需要基于之前的样本来建立对于声波样式的预测。DeepMind的工作人员表示,“这确实是非常有挑战性的任务。”

  很多现有的人工声音合成器多是先录制大量的人声语音片段,建立一个大型数据库,并将这些语音片段重新组合成完整的话语。这样生成的声音接近真实人声,但并不完全自然。而缺点在于如此产生的声音并不能被简单地更改。据DeepMind透露,另外一些系统可以完全电子化地生成声音,这样尽管声音可简单地被操作修改,但并不接近真实的人声。

  在人工智能里,尽管人们似乎一直以来对语音识别更有兴趣,而冷淡了计算机语音合成这一冷门的领域。但各大科技公司都不放过应用越来越普遍的人机交互。亚马逊、苹果、微软和谷歌的母公司Alphabet都投入了个人数字化助手同客户进行互动。

  今年早些时候,DeepMind的人工智能AlphaGo击败了韩国围棋大师李世石,引起了人们广泛的关注。谷歌一直都对将如何运用其人工智能技术守口如瓶,称已经利用这些技术降低了其数据中心40%的电量,剩下的钱足以让谷歌收购来自伦敦的DeepMind。谷歌还表示,DeepMind使得从YouTube到谷歌广告产品的一系列服务得到了明显的改善。


  来源:华尔街见闻
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|联系我们|用户须知|小黑屋|法律申明|隐私通告|华发网海外版china168.info

GMT-6, 2024-11-15 07:40

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表