![短时语音识别性能提升方法](/CN/2022/1/103/images/202210517405.jpg)
基本信息:
- 专利标题: 短时语音识别性能提升方法
- 申请号:CN202210517405.7 申请日:2022-05-12
- 公开(公告)号:CN114863913A 公开(公告)日:2022-08-05
- 发明人: 钮益峰 , 钱基业 , 李小平 , 杨勇 , 何攻 , 尹心 , 程晓 , 万凌云
- 申请人: 国网重庆市电力公司电力科学研究院 , 国网重庆市电力公司超高压分公司 , 国网重庆市电力公司 , 国家电网有限公司
- 申请人地址: 重庆市渝北区北部新区黄山大道中段80号办公综合楼; ; ;
- 专利权人: 国网重庆市电力公司电力科学研究院,国网重庆市电力公司超高压分公司,国网重庆市电力公司,国家电网有限公司
- 当前专利权人: 国网重庆市电力公司电力科学研究院,国网重庆市电力公司超高压分公司,国网重庆市电力公司,国家电网有限公司
- 当前专利权人地址: 重庆市渝北区北部新区黄山大道中段80号办公综合楼; ; ;
- 代理机构: 成都九鼎天元知识产权代理有限公司
- 代理人: 王会改
- 主分类号: G10L15/02
- IPC分类号: G10L15/02 ; G10L15/06 ; G10L15/26
摘要:
本发明公开了一种短时语音识别性能提升方法,该方法包括步骤:步骤1:对待识别短时语音进行预处理;步骤2:将预处理后的结果输入已训练好的语音识别模型进行识别处理;步骤3:对步骤2中的语音识别模型的输出结果进行后处理。预处理包括依次进行语音提取和语音延拓处理。后处理包括依次进行识别结果重组和发音相似度匹配处理。本发明为已训练好的语音识别模型增加语音预处理和结果后处理,无需重新训练,即可提升短时语音识别的性能。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L15/00 | 语音识别 |
--------G10L15/02 | .语音识别的特征提取;识别单位的选择 |