专利号CN202311735038.9 | 一种自适应近远场的离线语音命令词识别方法、系统及介质

发明公开 CN117437913A 一种自适应近远场的离线语音命令词识别方法、系统及介质 有权

专利标题：一种自适应近远场的离线语音命令词识别方法、系统及介质
申请号：CN202311735038.9 申请日：2023-12-18
公开(公告)号：CN117437913A 公开(公告)日：2024-01-23
发明人：余倬先 , 樊绍胜 , 欧阳峰 , 宋运团 , 孙文敏 , 余震 , 冷望
申请人：深圳昱拓智能有限公司
申请人地址：广东省深圳市龙华区民治街道北站社区鸿荣源北站中心B塔2107
专利权人：深圳昱拓智能有限公司
当前专利权人：深圳昱拓智能有限公司
当前专利权人地址：广东省深圳市龙华区民治街道北站社区鸿荣源北站中心B塔2107
代理机构：湖南兆弘专利事务所
代理人：刘畅舟
主分类号： G10L15/20
IPC分类号： G10L15/20 ; G10L15/08 ; G10L15/22 ; G10L21/0364

摘要：

本发明公开了一种自适应近远场的离线语音命令词识别方法、系统及介质，方法包括：以指定的时间间隔获取语音数据片段并更新语音数据，对语音数据音量自适应增强后进行唤醒识别，若能识别则提取人声部分，保存人声部分特征与识别词，若无法识别则提取人声部分，将人声部分特征与已保存的人声部分特征进行匹配，将匹配结果的识别词作为唤醒词；若识别到唤醒词，获取新的语音数据，对语音数据音量自适应增强后进行命令识别，若能识别则提取人声部分，保存人声部分特征与识别词，若无法识别则提取人声部分，将人声部分特征与已保存的人声部分特征进行匹配，将匹配结果的识别词作为命令词。本发明解决了近远场不定环境下，远场声音难以识别的问题。

CN117437913B 一种自适应近远场的离线语音命令词识别方法、系统及介质公开/授权日：2024-03-19

中国专利公布公告审查信息 Global Dossier Espacenet

G	物理
--G10	乐器；声学
----G10L	语言分析或合成；语言识别
------G10L15/00	语音识别
--------G10L15/20	.特别适用于不利环境（例如，噪音环境）中增强语音强度的语音识别技术

发明公开 CN117437913A 一种自适应近远场的离线语音命令词识别方法、系统及介质 有权

基本信息:

公开/授权文献:

信息查询:

IPC结构图谱:

IPRDB

热门服务

关于我们

友情链接

联系方式