语音系统 新人工智能语音系统高效复制人声 1分钟就能模仿

时间:2020-12-06手机版

科技日报北京5月3日电(记者聂翠蓉)据《科学美国人》杂志网站2日报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类讲话,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,哇!这是计算机。背后原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。

而琴鸟公司的AI使用了一种全新的语音合成系统,能在倾听过程中掌握每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,说出全新的语句。

新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠任何人1分钟讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。

但美国卡内基梅隆大学语言技术研究所教授迪莫鲍曼表示,琴鸟的语音系统和真正的人声之间还有差距。我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。

总编辑圈点

人类的嗓音最美妙,天籁之音怎能被机器模仿出来?一呼一吸间的抑扬顿挫,一颦一笑间的情感起伏,才是人之为人的精华所在。虽然机器模仿人声还差强人意,但仍大有用武之地高德地图林志玲版,不就是机器通过学习特殊语料后,模仿独特人声在给司机指路嘛。但需知,语音合成只是人工智能的一个基础层次,要想达到以假乱真甚至人机交互,估计还得一二十年。

上一篇:彭德怀的儿子 为有牺牲多壮志毛泽东面对亲人的死亡下一篇:天狗咬日 天狗咬日今日上演 快来看看在哪里能看得到

相关内容

  • 日本投降 日本投降73周年纪念日勿忘国耻 缅怀先烈

    日本投降今天是8月15日,日本宣布无条件投降73周年纪念日。14日,在四川广汉的抗战阵亡将士纪念碑前,当地各界群众自发聚在一起,重温历史、缅怀先烈。在广汉抗战阵亡将士纪念碑前,公安民警、青年代表、志愿者们自发来到这里,驻足碑前,全体肃立、默哀致敬,静静聆听着那段波澜壮阔的抗战史,表达对抗战阵亡将士们的崇敬与哀思之情。据资料统计,在抗日战争期间,共有300多万四川儿女奔赴战场,足迹遍及13个省市

    2020-12-14

  • 哥哥射影院 女子献身干哥哥治阳痿 与嫂子三人同床治病

    哥哥射影院扬子晚报12月2日报道老公患阳痿,夫妻时常吵架,甚至闹到要离婚的地步,干妹妹看在眼里急在心里,提出为干哥哥献身一次,想通过刺激的方法治好他的病,夫妻俩也想到吸食冰毒来刺激一下,于是老公开宾馆三人吸毒“溜冰”后,上演了荒唐的轮番“治病”一幕。近日,开房间请老婆和干妹妹吸毒的刘大川在缓刑期内再次涉嫌容留他人吸毒罪,被移送南京市秦淮区检察院审查。30岁的刘大川开了家洗头房,今年6月因犯容留

    2020-12-14

  • 引领 红色通缉第一集引领

    引领【资料:十九大之后归案的百名红通人员一组】新闻播报:2017年12月1日,潜逃9年的百名红通人员周骥阳被缉捕归案,意味着百名红通人员已经半数到案。2017年12月6日,百名红通人员李文革回国投案,到案人数迅速实现从到半至过半的转变。2018年1月24日,百名红通人员胡玉兴回国投案。2018年6月20日,百名红通人员袁梅回国投案。2018年7月28日,百名红通人员张勇光主动回国投案并退

    2020-12-14

热门tag