最后我再介绍一下我们近期开展的基于序列到序列模型框架的非平行语音转换方法的研究工作 。 虽然前面介绍的VCC2018方法可以取得较好的非平行语音转换效果 , 但是其仍存在一些不足 。 例如 , 基于语音识别器提取的文本内容表征中难以保证不含有说话人相关信息、语音识别模型和转换生成模型没有联合训练、仍采用帧到帧映射的模型框架等 。
因此 , 我们提出了一种基于表征解耦的序列到序列非平行语音转换方法 。 该方法在序列到序列建模框架下 , 可以实现对于语音中文本相关内容和话者相关内容的有效分离 。 其核心思想如图所示 。 在训练阶段 , 利用识别编码器和话者编码器分别提取语音中的文本和话者相关表征 。 同时我们通过训练准则的设计保证这两种表征相互独立 , 不会纠缠 。 在训练过程中 , 我们也会利用语音对应的转写文本 。 从转写文本中提取的信息可以为从语音中提取文本表征提供有效参考 。 在合成阶段 , 通过组合从源说话人语音中提取的文本表征 , 以及目标说话人的话者表征 , 可以实现从源说话人语音到目标说话人语音的转换 。
推荐阅读
-
西奇博物馆|连续公务多日泰王又腿软,王后苏提达浓妆遮盖疲惫,努力搀扶泰王
-
-
-
家电消费网|分析:OPPO为何进入亏损的彩电业?,OPPO电视将发布
-
-
-
-
-
-
#饭饭妈妈育儿#实则却在悄悄损害孩子听力,你别大意,掏耳朵看似一种正常的行为
-
海外网|前"港独"组织召集人涉违香港国安法被捕 保释申请被拒
-
-
世界体育圈|穆雷心态崩了,帕金斯正式表态!,西部半决赛来了!掘金喊话快船
-
[晓哥聊游戏]千万不要进去,因为里面有人在钓鱼!,和平精英:在门口看到这个东西
-
-
-
-
科技快报网|Waymo将在6月恢复自动驾驶货运服务
-
居然令人难以想象地实现欧冠赛场全胜夺冠,更向世人宣布,世界足坛已发生巨变,德甲早已满血归来
-
【太平洋电脑网】华为 nova 7 Pro 发布会后:关晓彤、易烊千玺将开箱展示