
基本信息:
- 专利标题: 一种基于扩散模型的遮拦语言去噪方法及装置
- 申请号:CN202410587159.1 申请日:2024-05-13
- 公开(公告)号:CN118194847A 公开(公告)日:2024-06-14
- 发明人: 康峰 , 苏立伟 , 刘振华 , 谭火超 , 陈宋 , 刘娟 , 覃浩 , 陈海燕 , 梁寿愚 , 吴石松 , 杨晓东 , 魏焱 , 肖小清 , 梁瑞莹 , 刘世辉 , 王帅
- 申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
- 申请人地址: 广东省广州市越秀区东风东路757号
- 专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人地址: 广东省广州市越秀区东风东路757号
- 代理机构: 广州三环专利商标代理有限公司
- 代理人: 郑晓璇
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/284 ; G06N20/00
摘要:
本发明公开了一种基于扩散模型的遮拦语言去噪方法及装置,包括:获取被遮拦的语句信息;其中,所述被遮拦的语句信息包括被遮拦词语和未被遮拦语句;将所述被遮拦的语句信息输入至预设吸收状态的离散扩散模型之中,从而输出得到对应该被遮拦词语的去噪信息,进而得到完整的语句信息。本发明通过获取被遮拦的语句信息,可以准确地识别出被遮拦的词语,从而避免了对完整语句信息的误解或丢失,同时将所述被遮拦的语句信息输入至预设吸收状态的离散扩散模型中,可以利用模型对被遮拦词语进行去噪处理,得到更准确的去噪信息,本发明相比其他文本扩散模型,提升了质量、效率和多样性,可以大大加速训练过程,降低计算成本,减少碳足迹。
IPC结构图谱:
G06F40/205 | 解析 |