
基本信息:
- 专利标题: 一种语音情绪识别方法、装置、电子设备及存储介质
- 申请号:CN202411053241.2 申请日:2024-08-02
- 公开(公告)号:CN118571267B 公开(公告)日:2024-11-12
- 发明人: 王红红 , 杨腾 , 张徐吉
- 申请人: 北京远鉴信息技术有限公司
- 申请人地址: 北京市海淀区西四环北路119号A座3层320室
- 专利权人: 北京远鉴信息技术有限公司
- 当前专利权人: 北京远鉴信息技术有限公司
- 当前专利权人地址: 北京市海淀区西四环北路119号A座3层320室
- 代理机构: 北京超凡宏宇知识产权代理有限公司
- 代理人: 刘凤
- 主分类号: G10L25/63
- IPC分类号: G10L25/63 ; G10L25/30
摘要:
本申请提供了一种语音情绪识别方法、装置、电子设备及存储介质,包括:将目标语音输入至语音情绪识别的特征编码网络层,进行特征编码处理得到第一特征向量以及注意力权重矩阵,对注意力权重矩阵进行重要程度计算得到第一情绪重要程度分数序列,将第一情绪重要程度分数序列以及第一特征向量输入至多个特征动态编码模块之中进行动态全局窗口以及动态局部窗口的编码处理,输出目标特征向量以及目标特征向量的目标情绪重要程度分数序列;将目标特征向量输入至情绪分类网络层之中,对目标特征向量进行平均池化处理以及多层感知机分类处理,输出目标语音的情绪标签,实现了捕捉分散在语音的不同区域的语音情感信息,有效提高了语音情绪识别的准确率。
公开/授权文献:
- CN118571267A 一种语音情绪识别方法、装置、电子设备及存储介质 公开/授权日:2024-08-30
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L25/00 | 不限于组G10L15/00-G10L21/00的语言或者声音分析技术 |
--------G10L25/48 | .专门适用于特定用途 |
----------G10L25/51 | ..比较或判别 |
------------G10L25/63 | ...情感状态估计 |