当前位置:首页 > 新闻中心 > 科研动态

科研动态

智能交互团队提出韵律与音色解耦建模的新方法,接连斩获大赛佳绩

  • 发表日期:2021-03-05 【彩票55重庆时时彩 【打印】【关闭】
  •   中科院自动化所智能交互团队多年来深耕语音生成技术,提出韵律与音色个性化解耦建模方法,为小样本语音模仿提供了一种有效的途径。 

      语音模仿技术是指利用一定量的目标人数据生成目标语音,在生活、娱乐、新闻、教育、医疗、金融等重多领域具有广泛的应用前景。但是,在小样本场景下该技术存在声音模仿相似度低和鲁棒性差的问题,这是当前面临的关键技术挑战。针对上述挑战,团队积极开展研究,推动语音模仿技术将声音的要素有效分解,从而解决语音模仿技术对目标人数据需求量大的问题。 

      凭借相关技术成果,团队多次在国内外语音模仿大赛中取得突出成绩。20192020年连续两年获工信部主办的“个性化语音合成”比赛冠军。2021年获依托语音领域国际顶级会议ICASSP举办的“多说话人多风格音色克隆大赛(M2VoC)”的极少样本闭集赛道(给定5个语音样本约1分钟)赛道冠军。 

      据悉,“个性化语音合成”比赛由工业和信息化部信息中心、国家工业信息安全发展研究中心等联合主办,大赛旨在发掘人工智能领域原创技术、创新产品和变革应用,推动人工智能创新创业项目落地。大赛决赛分为应用挑战和双创激荡两个大的方向,经过专家评审,共有55支队伍参加现场总决赛。“个性化语音合成”赛道的任务是利用50句约10分钟的语音模仿目标说话人的说话风格信息。M2VoC国际挑战赛依托2021年语音声学领域国际顶级会议(ICASSP 2021)举办,旨在提供一个通用的数据集以及一个公平的测试平台,对语音克隆模仿任务进行研究,共150多支队伍报名。极少样本闭集赛道(给定5个语音样本约1分钟)只能使用比赛提供的数据训练模型,难度极高。 

      相关技术研究能够为个性化语音生成提供理论支持,可以大幅降低语音模拟的经济与时间成本,对多媒体信息智能生成的发展具有重要意义。 

     

    彩票55重庆时时彩 京公网安备110108003079号
    地址:北京市海淀区中关村东路95号 邮编:100190 Email:casia@ia.ac.cn
    网站地图 彩票55加拿大28 彩票55斯洛伐克5分彩 彩22新疆11选5
    太阳城申博桌面安装版 申博官网下载 澳门现金赌场网址 申博娱乐开户官网
    捕鱼假日凤凰石 千亿国际娱乐网址登入 568专业彩票网会员中心登入 菲律宾太阳城入囗网
    彩票55香港二分彩 suncity818登入 彩票55重庆时时彩 彩票55上海快3
    彩22黑龙江时时彩 彩票55广西快十 彩票55湖北快3 彩票55幸运28
    318XTD.COM 519tt.com 666xsb.com 958XTD.COM 523SUN.COM
    558jbs.com 68XTD.COM XSB4444.COM 15s8.com 978jbs.com
    888xsb.com 100xsb.com 1112934.COM 581tt.com 998XTD.COM
    115sunbet.com 768XTD.COM 33sbsun.com 55TGP.COM 587sj.com