
基本信息:
- 专利标题: 确定歌词时间戳信息的方法和声学模型的训练方法
- 申请号:CN202011577438.8 申请日:2020-12-28
- 公开(公告)号:CN112786025B 公开(公告)日:2023-11-14
- 发明人: 王武城 , 赵伟峰
- 申请人: 腾讯音乐娱乐科技(深圳)有限公司
- 申请人地址: 广东省深圳市前海深港合作区前湾一路1号A栋201室
- 专利权人: 腾讯音乐娱乐科技(深圳)有限公司
- 当前专利权人: 腾讯音乐娱乐科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市前海深港合作区前湾一路1号A栋201室
- 代理机构: 北京三高永信知识产权代理有限责任公司
- 代理人: 宁立存
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/26 ; G10L17/04 ; G10L25/00
摘要:
本申请公开了一种确定歌词时间戳信息的方法和声学模型的训练方法,属于互联网技术领域。所述方法包括:将所述目标歌词文本中包括的非中文歌词替换为对应的谐音汉字,得到替换后的歌词文本;确定所述替换后的歌词文本中每个字对应的音素组成的音素集合;将所述目标歌词文本对应的目标干声音频以及所述音素集合中的各音素输入到预先训练的声学模型,得到所述目标干声音频对应的音素序列;确定所述替换后的歌词文本中每个字在所述音素序列中对应的音素,基于所述替换后的歌词文本中每个字在所述音素序列中对应的音素,以确定所述目标歌词文本对应的歌词时间戳信息。采用本申请能够提高得到歌曲对应的歌词时间戳信息的效率。
公开/授权文献:
- CN112786025A 确定歌词时间戳信息的方法和声学模型的训练方法 公开/授权日:2021-05-11
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L15/00 | 语音识别 |
--------G10L15/06 | .创建基准模板;训练语音识别系统,例如对说话者声音特征的适应 |