欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

Live | 浙江大学硕士生任意:非自回归语音合成

最编程 2024-04-30 13:52:24
...

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到浙江大学计算机学院 2019 级硕士,为大家带来非自回归语音合成的专题直播。对本期主题感兴趣的小伙伴,3 月 9 日(周二)晚 7 点,我们准时相约 PaperWeekly B 站直播间。

直播信息

语音合成技术目前被广泛应用于智能助手、电话客服、虚拟人等人机交互场景。目前基于深度学习的语音合成根据合成语音的方式,主要可以分为两大方向:自回归和非自回归。自回归语音合成使用序列到序列生成模型的思想,可以达到目前最优的合成效果,但是合成速度且不可控;非自回归语音合成则通过全并行网络结构,通过一次前馈计算生成整句语音,它的优点是速度快、可控性强,并可以达到非常接近自回归模型的合成性能。


本次分享我们将从 FastSpeech 系列模型展开,对非自回归语音合成的主流方法作一个介绍,并展望未来非自回归语音合成的研究方向。

本次分享的具体内容有: 

  • 回顾主流的几类基于深度学习的语音合成模型

  • 介绍非自回归语音合成的动机和做法

  • 介绍当前非自回归语音合成的主要研究方向

  • 展望未来语音合成的走向

嘉宾介绍

 任意 / 浙江大学计算机系硕士生 

任意,浙江大学计算机学院 2019 级硕士,导师为赵洲老师,曾在 NeurIPS、ICML、ICLR 等人工智能顶会发表论文十余篇,曾获 2020 年度百度奖学金和字节奖学计划,主要关注语音合成、机器翻译和自动作曲等方向。

直播地址 & 交流群

本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道

B 站直播间:

https://live.bilibili.com/14884511

合作伙伴

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。