
基本信息:
- 专利标题: 一种演讲者识别方法及其装置、设备、存储介质
- 申请号:CN202311766277.0 申请日:2023-12-19
- 公开(公告)号:CN117854510A 公开(公告)日:2024-04-09
- 发明人: 许乾坤 , 高建清 , 马峰 , 管青松
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新开发区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新开发区望江西路666号
- 代理机构: 深圳市威世博知识产权代理事务所
- 代理人: 何倚雯
- 主分类号: G10L17/06
- IPC分类号: G10L17/06 ; G10L17/02 ; G10L15/26 ; G10L15/183
摘要:
本申请公开了一种演讲者识别方法及其装置、设备、存储介质,该方法包括:对当前语音进行识别,得到当前语音的识别文本;基于识别文本,提取得到文本特征,并基于识别文本抽取,得到提示词,其中,提示词指示当前语音之后的发言内容中涵盖的字词类别;基于文本特征和提示词进行预测,得到当前语音之后的发言内容及其目标发言人。上述方案,能够提高当前语音之后的发言内容及其目标发言人识别的准确性。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L17/00 | 讲话者辨认或验证 |
--------G10L17/06 | .决策方法,模式适配策略 |