Live | 浙江大学硕士生任意:非自回归语音合成
「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到浙江大学计算机学院 2019 级硕士,为大家带来非自回归语音合成的专题直播。对本期主题感兴趣的小伙伴,3 月 9 日(周二)晚 7 点,我们准时相约 PaperWeekly B 站直播间。
直播信息
语音合成技术目前被广泛应用于智能助手、电话客服、虚拟人等人机交互场景。目前基于深度学习的语音合成根据合成语音的方式,主要可以分为两大方向:自回归和非自回归。自回归语音合成使用序列到序列生成模型的思想,可以达到目前最优的合成效果,但是合成速度且不可控;非自回归语音合成则通过全并行网络结构,通过一次前馈计算生成整句语音,它的优点是速度快、可控性强,并可以达到非常接近自回归模型的合成性能。
本次分享我们将从 FastSpeech 系列模型展开,对非自回归语音合成的主流方法作一个介绍,并展望未来非自回归语音合成的研究方向。
本次分享的具体内容有:
回顾主流的几类基于深度学习的语音合成模型
介绍非自回归语音合成的动机和做法
介绍当前非自回归语音合成的主要研究方向
展望未来语音合成的走向
嘉宾介绍
任意 / 浙江大学计算机系硕士生
任意,浙江大学计算机学院 2019 级硕士,导师为赵洲老师,曾在 NeurIPS、ICML、ICLR 等人工智能顶会发表论文十余篇,曾获 2020 年度百度奖学金和字节奖学计划,主要关注语音合成、机器翻译和自动作曲等方向。
直播地址 & 交流群
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道。
B 站直播间:
https://live.bilibili.com/14884511
合作伙伴
????
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
上一篇: [会议研究] 2022 年模式识别峰会
推荐阅读
-
在 vue3 中使用 KDDI 语音听写 Web API
-
Java 参数和非参数构造方法
-
linear_model.LinearRegression 用身高线性回归预测体重
-
机器学习:基于 Sklearn 和 XGBoost 框架,使用逻辑回归、支持向量机和 XGBClassifier 诊断和预测一个人是否患有自闭症-4。模型训练
-
机器学习 (VII) - 回归
-
嘀嗒干货分享:个人联盟适用类型(非白)与商品联盟推荐
-
16个值得个人站长做的广告联盟 [转自cnzz]
-
算法工程师 - SQL 高级:自连接和子查询的魔力
-
Broadway 使用符号访问方式,按位、字节或字访问非结构化数据类型。
-
关于任意切割 3D 模型的思考