
基本信息:
- 专利标题: 基于CDAR模型的跨库语音情感识别方法及装置
- 申请号:CN202211010154.X 申请日:2022-08-23
- 公开(公告)号:CN115497508A 公开(公告)日:2022-12-20
- 发明人: 宗源 , 连海伦 , 郑文明 , 常洪丽 , 路成 , 唐传高 , 赵焱
- 申请人: 东南大学
- 申请人地址: 江苏省南京市江宁区东南大学路2号
- 专利权人: 东南大学
- 当前专利权人: 东南大学
- 当前专利权人地址: 江苏省南京市江宁区东南大学路2号
- 代理机构: 南京苏高专利商标事务所
- 代理人: 冯艳芬
- 主分类号: G10L25/63
- IPC分类号: G10L25/63 ; G10L15/02 ; G10L15/06 ; G10L15/08 ; G10L15/16
摘要:
本发明公开了一种基于CDAR模型的跨库语音情感识别方法及装置,方法包括:(1)获取两个语音情感数据库,分别作为训练数据库和测试数据库,(2)从训练数据库和测试数据库中提取具有相同情感类别标签的语音样本,分别作为源域样本和目标域样本,并提取源域样本和目标域样本的IS09特征作为样本特征;(3)建立协同分布适配回归CDAR模型,(4)利用交替方向法和非精确增广拉格朗日乘子求解CDAR模型,得到投影矩阵U的最优值(5)对于待识别语音,提取IS09特征,并采用学习到的投影得到对应的情感类别。本发明识别准确率更高。
公开/授权文献:
- CN115497508B 基于CDAR模型的跨库语音情感识别方法及装置 公开/授权日:2025-02-25
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L25/00 | 不限于组G10L15/00-G10L21/00的语言或者声音分析技术 |
--------G10L25/48 | .专门适用于特定用途 |
----------G10L25/51 | ..比较或判别 |
------------G10L25/63 | ...情感状态估计 |