![一种少语料的语音模型训练及合成方法](/CN/2021/1/112/images/202110561416.jpg)
基本信息:
- 专利标题: 一种少语料的语音模型训练及合成方法
- 申请号:CN202110561416.0 申请日:2021-05-22
- 公开(公告)号:CN112992118A 公开(公告)日:2021-06-18
- 发明人: 曹艳艳 , 陈佩云
- 申请人: 成都启英泰伦科技有限公司
- 申请人地址: 四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层
- 专利权人: 成都启英泰伦科技有限公司
- 当前专利权人: 成都启英泰伦科技有限公司
- 当前专利权人地址: 四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层
- 主分类号: G10L13/10
- IPC分类号: G10L13/10 ; G10L13/02 ; G10L13/033 ; G10L19/18
摘要:
一种少语料的语音模型训练及合成方法,包括模型训练及语音合成;所述模型训练包括如下步骤:S1.收集训练样本集;S2.对各个样本进行音素化处理,提取梅尔特征;S3.对语音模型进行训练,得到泛化模型MA;S4.将基准音色样本在泛化模型MA基础上做微调训练,得到基准模型MB;S5.将训练样本集的所有样本按音色分类,训练音色转化的转换模型MTR;S6.使用训练样本集的所有样本训练得到每个音色对应的个性声码器模型MG。本发明仅需要基准音色较大数据量,即可实现对其他音色的少语料训练并得到合成音频所需模型,模型训练时间缩短,通过转换模型和个性声码器模型训练,提升了后续语音合成效果。
公开/授权文献:
- CN112992118B 一种少语料的语音模型训练及合成方法 公开/授权日:2021-07-23
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L13/00 | 语音合成;正文—语音合成系统 |
--------G10L13/02 | .产生合成语音的方法;语音合成设备 |
----------G10L13/10 | ..来自文本的韵律规则;重音或声调 |