
基本信息:
- 专利标题: 一种语音增强方法、装置、设备及存储介质
- 申请号:CN202111326968.X 申请日:2021-11-10
- 公开(公告)号:CN113889132B 公开(公告)日:2025-02-07
- 发明人: 姜彦吉 , 田桂源 , 刘海涛 , 彭博 , 郑四发
- 申请人: 清华大学苏州汽车研究院(相城)
- 申请人地址: 江苏省苏州市相城区高铁新城太阳路2266号5幢
- 专利权人: 清华大学苏州汽车研究院(相城)
- 当前专利权人: 清华大学苏州汽车研究院(相城)
- 当前专利权人地址: 江苏省苏州市相城区高铁新城太阳路2266号5幢
- 代理机构: 北京品源专利代理有限公司
- 代理人: 初春
- 主分类号: G10L21/02
- IPC分类号: G10L21/02 ; G10L15/16
摘要:
本发明实施例公开了一种语音增强方法、装置、设备及存储介质。该方法包括:将待处理的带噪语音信号输入到目标语音增强模型中;其中,所述目标语音增强模型包含编码网络、降噪网络和解码网络;通过所述编码网络,对所述带噪语音信号执行编码操作,得到输出的编码语音特征;将所述编码语音特征输入到所述降噪网络中,得到输出的降噪语音特征;基于所述编码语音特征、降噪语音特征和所述解码网络,确定与所述带噪语音信号对应的增强语音信号。本发明实施例通过直接将带噪语音信号输入到目标语音增强模型中,解决了频域语音增强方法需要时域变换的问题,既缩短了语音增强的计算时间,又提高了语音增强的效果。
公开/授权文献:
- CN113889132A 一种语音增强方法、装置、设备及存储介质 公开/授权日:2022-01-04
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L21/00 | 为了改变语音信号的品质或其可理解性而处理语音信号以产生另一种可听的或非可听的信号,例如视觉信号、触觉信号 |
--------G10L21/02 | .语音增强,例如降低噪声、消除回声 |