
基本信息:
- 专利标题: 基于深度学习的语音端点检测方法、装置和计算机设备
- 申请号:CN202310146818.3 申请日:2023-02-22
- 公开(公告)号:CN115985347B 公开(公告)日:2023-06-27
- 发明人: 李鹏 , 黄文琦 , 林全郴 , 冯勤宇 , 梁凌宇 , 习伟
- 申请人: 南方电网数字电网研究院有限公司
- 申请人地址: 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 专利权人: 南方电网数字电网研究院有限公司
- 当前专利权人: 南方电网数字电网研究院有限公司
- 当前专利权人地址: 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 代理机构: 华进联合专利商标代理有限公司
- 代理人: 樊倩
- 主分类号: G10L25/87
- IPC分类号: G10L25/87 ; G10L25/78 ; G06N20/00
摘要:
本申请涉及一种基于深度学习的语音端点检测方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取待识别音频信号中各个音帧对应的音频数据;对各个音帧对应的音频数据进行听觉特征提取,得到各音帧对应的音频听觉特征;对各音帧对应的音频听觉特征进行编码特征提取,得到各音帧对应的音频编码特征;对各音帧对应的音频编码特征进行分类处理,得到各音帧对应的音帧类别概率向量;音帧类别概率向量表征相应的音帧为语音帧的概率信息和音帧为非语音帧的概率信息;根据各音帧对应的音帧类别概率向量,确定待识别音频信号中的语音端点。采用本方法能够准确地识别语音段的端点位置。
公开/授权文献:
- CN115985347A 基于深度学习的语音端点检测方法、装置和计算机设备 公开/授权日:2023-04-18
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L25/00 | 不限于组G10L15/00-G10L21/00的语言或者声音分析技术 |
--------G10L25/78 | .语音信号存在或不存在的检测 |
----------G10L25/87 | ..语音信号内离散点的检测 |