![文本生成模型训练方法、文本生成方法、装置及电子设备](/CN/2024/1/75/images/202410377598.jpg)
基本信息:
- 专利标题: 文本生成模型训练方法、文本生成方法、装置及电子设备
- 申请号:CN202410377598.X 申请日:2024-03-29
- 公开(公告)号:CN118333016A 公开(公告)日:2024-07-12
- 发明人: 张龙图 , 谈昊
- 申请人: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
- 申请人地址: 浙江省杭州市滨江区江陵路1760号
- 专利权人: 浙江吉利控股集团有限公司,吉利汽车研究院(宁波)有限公司
- 当前专利权人: 浙江吉利控股集团有限公司,吉利汽车研究院(宁波)有限公司
- 当前专利权人地址: 浙江省杭州市滨江区江陵路1760号
- 代理机构: 北京隆源天恒知识产权代理有限公司
- 代理人: 戴棋钦
- 主分类号: G06F40/166
- IPC分类号: G06F40/166 ; G06N3/0442 ; G06N3/0455 ; G06N3/047 ; G06F40/30 ; G06F40/237 ; G06N3/08
摘要:
本发明提供了一种文本生成模型训练方法、文本生成方法、装置及电子设备,涉及人工智能技术领域,所述文本生成模型包括策略网络和价值网络,文本生成模型训练方法包括:对第一训练数据进行编码,得到第一向量;基于第一向量,通过策略网络确定预设动作空间中各动作的概率分布,根据概率分布指导蒙特卡洛树搜索,生成第二训练数据;其中,预设动作空间为预设词表,预设词表包括文字笔画集合以及笔画位置关系集合;采用第二训练数据训练价值网络;采用经训练的价值网络,优化策略网络,以获得训练好的文本生成模型。本发明能降低文本生成模型的训练成本和计算量,提高生成模型的训练效率和性能。
IPC结构图谱:
G06F40/166 | 编辑,例如插入或删除 |