
基本信息:
- 专利标题: 一种自适应近远场的离线语音命令词识别方法、系统及介质
- 申请号:CN202311735038.9 申请日:2023-12-18
- 公开(公告)号:CN117437913A 公开(公告)日:2024-01-23
- 发明人: 余倬先 , 樊绍胜 , 欧阳峰 , 宋运团 , 孙文敏 , 余震 , 冷望
- 申请人: 深圳昱拓智能有限公司
- 申请人地址: 广东省深圳市龙华区民治街道北站社区鸿荣源北站中心B塔2107
- 专利权人: 深圳昱拓智能有限公司
- 当前专利权人: 深圳昱拓智能有限公司
- 当前专利权人地址: 广东省深圳市龙华区民治街道北站社区鸿荣源北站中心B塔2107
- 代理机构: 湖南兆弘专利事务所
- 代理人: 刘畅舟
- 主分类号: G10L15/20
- IPC分类号: G10L15/20 ; G10L15/08 ; G10L15/22 ; G10L21/0364
摘要:
本发明公开了一种自适应近远场的离线语音命令词识别方法、系统及介质,方法包括:以指定的时间间隔获取语音数据片段并更新语音数据,对语音数据音量自适应增强后进行唤醒识别,若能识别则提取人声部分,保存人声部分特征与识别词,若无法识别则提取人声部分,将人声部分特征与已保存的人声部分特征进行匹配,将匹配结果的识别词作为唤醒词;若识别到唤醒词,获取新的语音数据,对语音数据音量自适应增强后进行命令识别,若能识别则提取人声部分,保存人声部分特征与识别词,若无法识别则提取人声部分,将人声部分特征与已保存的人声部分特征进行匹配,将匹配结果的识别词作为命令词。本发明解决了近远场不定环境下,远场声音难以识别的问题。
公开/授权文献:
- CN117437913B 一种自适应近远场的离线语音命令词识别方法、系统及介质 公开/授权日:2024-03-19
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L15/00 | 语音识别 |
--------G10L15/20 | .特别适用于不利环境(例如,噪音环境)中增强语音强度的语音识别技术 |