![一种用于语音情感识别的高质量数据增强样本获取方法](/CN/2023/1/127/images/202310639671.jpg)
基本信息:
- 专利标题: 一种用于语音情感识别的高质量数据增强样本获取方法
- 申请号:CN202310639671.1 申请日:2023-06-01
- 公开(公告)号:CN116705075A 公开(公告)日:2023-09-05
- 发明人: 陶华伟 , 单帅 , 于航 , 胡子怡 , 程勇 , 李倩倩 , 朱春华 , 傅洪亮 , 杨静 , 邹曙光 , 王学梅
- 申请人: 河南工业大学
- 申请人地址: 河南省郑州市高新技术开发区莲花街100号河南工业大学科技处
- 专利权人: 河南工业大学
- 当前专利权人: 河南工业大学
- 当前专利权人地址: 河南省郑州市高新技术开发区莲花街100号河南工业大学科技处
- 主分类号: G10L25/63
- IPC分类号: G10L25/63 ; G10L21/0208 ; G10L25/30 ; G06N3/0464 ; G06N3/08
摘要:
本发明公开了一种用于语音情感识别的高质量数据增强样本获取方法。方法步骤包括:(1)将情感语料库划分为训练集和测试集;(2)对训练集中的样本实施基于信号的扰动以获得增强数据集;(3)使用训练集样本对语音情感识别模型进行训练;(4)使用训练好的模型对增强数据集中样本进行识别并获得样本伪标签,在此过程中挑选出低不确定性且高置信度预测的样本;(5)将挑选出的样本伪标签与该样本实施扰动之前的标签进行比较,进一步剔除噪声样本,将最终保留的高质量增强样本并入训练集;(6)重复步骤(3)至(5),在训练达到预设的轮次之后,对测试集样本进行情感识别;在IEMOCAP和EMODB上的仿真结果表明,本发明所公开方法可有效避免噪声样本对模型的影响,从而提升模型的性能表现。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L25/00 | 不限于组G10L15/00-G10L21/00的语言或者声音分析技术 |
--------G10L25/48 | .专门适用于特定用途 |
----------G10L25/51 | ..比较或判别 |
------------G10L25/63 | ...情感状态估计 |