![一种基于伴奏分离和人声分离的戏曲人声提取方法及系统](/CN/2024/1/166/images/202410833330.jpg)
基本信息:
- 专利标题: 一种基于伴奏分离和人声分离的戏曲人声提取方法及系统
- 申请号:CN202410833330.2 申请日:2024-06-26
- 公开(公告)号:CN118737184A 公开(公告)日:2024-10-01
- 发明人: 郭慧 , 胡斌 , 李俊林
- 申请人: 梧州学院
- 申请人地址: 广西壮族自治区梧州市富民三路82号
- 专利权人: 梧州学院
- 当前专利权人: 梧州学院
- 当前专利权人地址: 广西壮族自治区梧州市富民三路82号
- 代理机构: 广州三环专利商标代理有限公司
- 代理人: 杨振鹏
- 主分类号: G10L21/028
- IPC分类号: G10L21/028 ; G10L21/0232 ; G10L21/0224 ; G10L19/16 ; G10L25/18 ; G10L25/21 ; G10L25/24 ; G10L25/48
摘要:
本发明公开了一种基于伴奏分离和人声分离的戏曲人声提取方法及系统,包括以下步骤:在若干音频数据中筛选出包含戏曲人声的音频数据,并基于包含戏曲人声的音频数据形成目标音频数据集;将目标音频数据集采用基于频率特征的分离方法进行伴奏分离,得到分离音频数据集;对分离音频数据集采用基于音色的人声分离方法进行戏曲人声分离,得到戏曲人声数据集;将戏曲人声数据集输入到CVAE编码器筛选戏曲人声,并形成隐空间特征集;基于外部条件通过解码器从隐空间特征集提取隐空间特征点,并基于隐空间特征点输出戏曲人声。本发明用于解决戏曲人声与二胡声难以分离的技术问题,达到提高人声模型的声音质量的目的。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L21/00 | 为了改变语音信号的品质或其可理解性而处理语音信号以产生另一种可听的或非可听的信号,例如视觉信号、触觉信号 |
--------G10L21/003 | .改变声音质量,例如音调或共振峰 |
----------G10L21/0208 | ..噪声过滤 |
------------G10L21/028 | ...采用声源的属性 |