
基本信息:
- 专利标题: 音频数据生成装置、音频数据生成装置的对抗学习方法、音频数据生成装置的学习方法、及声音合成处理系统
- 申请号:CN202280051577.8 申请日:2022-06-21
- 公开(公告)号:CN117716421A 公开(公告)日:2024-03-15
- 发明人: 冈本拓磨 , 户田智基 , 河井恒
- 申请人: 国立研究开发法人情报通信研究机构
- 申请人地址: 日本东京
- 专利权人: 国立研究开发法人情报通信研究机构
- 当前专利权人: 国立研究开发法人情报通信研究机构
- 当前专利权人地址: 日本东京
- 代理机构: 北京康信知识产权代理有限责任公司
- 代理人: 赵曦
- 优先权: 2021-135430 20210823 JP
- 国际申请: PCT/JP2022/024682 2022.06.21
- 国际公布: WO2023/026654 JA 2023.03.02
- 进入国家日期: 2024-01-22
- 主分类号: G10L13/06
- IPC分类号: G10L13/06
摘要:
实现一种音频数据生成装置,能够在不使用能够高速处理的GPU的情况下高速地实现高品质的音频生成处理。在音频数据生成装置(100)中,具有通过多流生成部(1)获取多个流数据的结构,此外,通过导入能够学习的卷积处理部(3),能够进行与高精度的音频数据识别装置(Dev_D)的对抗学习。然后,通过利用该对抗学习获取的音频数据生成装置(100),能够进行高速且高精度的音频数据生成处理。此外,由于音频数据生成装置(100)具有简单的结构,所以能够在不使用能够高速处理的GPU的情况下高速地实现高品质的音频数据生成处理(例如,声音合成处理)。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L13/00 | 语音合成;正文—语音合成系统 |
--------G10L13/06 | .语音合成设备中使用的基本语音单位;级联规则 |