
基本信息:
- 专利标题: 声学事件的检测方法、装置、电子设备及存储介质
- 申请号:CN202311827242.3 申请日:2023-12-27
- 公开(公告)号:CN117877520A 公开(公告)日:2024-04-12
- 发明人: 王昕 , 许超 , 聂吉昌
- 申请人: 北京大学深圳研究院
- 申请人地址: 广东省深圳市高新技术产业园区南区深港产学研基地大楼东座五楼
- 专利权人: 北京大学深圳研究院
- 当前专利权人: 北京大学深圳研究院
- 当前专利权人地址: 广东省深圳市高新技术产业园区南区深港产学研基地大楼东座五楼
- 代理机构: 深圳智汇远见知识产权代理有限公司
- 代理人: 邓新
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L25/03 ; G10L25/87 ; G10L21/0232
摘要:
本申请涉及一种声学事件的检测方法、装置、电子设备及存储介质,方法包括:获取待检测音频数据,并确定待检测音频数据对应的至少两个目标增强频谱,其中,每个所述目标增强频谱对应的目标频谱类型不同;对任一所述目标增强频谱进行语音端点检测,确定所述待检测音频数据对应的目标频段;基于所述目标频段和所有所述目标增强频谱,确定所述待检测音频数据对应的声音类型;根据所述目标频段、所述声音类型,以及所有所述目标增强频谱进行声学事件检测,确定所述待检测音频数据对应的声学事件检测结果。由此可以实现提高声学事件检测的准确率和效率。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L25/00 | 不限于组G10L15/00-G10L21/00的语言或者声音分析技术 |
--------G10L25/48 | .专门适用于特定用途 |
----------G10L25/51 | ..比较或判别 |