
基本信息:
- 专利标题: 一种低资源场景下的文本生成方法、装置及系统
- 申请号:CN202210308980.6 申请日:2022-03-28
- 公开(公告)号:CN114611472B 公开(公告)日:2025-06-10
- 发明人: 李建欣 , 毛乾任 , 刘骏楠 , 蒋为峰 , 邓婷 , 邰振赢
- 申请人: 北京航空航天大学
- 申请人地址: 北京市海淀区学院路37号
- 专利权人: 北京航空航天大学
- 当前专利权人: 北京航空航天大学
- 当前专利权人地址: 北京市海淀区学院路37号
- 代理机构: 北京中创阳光知识产权代理有限责任公司
- 代理人: 尹振启
- 主分类号: G06F40/166
- IPC分类号: G06F40/166 ; G06N3/09 ; G06N3/088
摘要:
本发明提出了一种低资源场景下的文本生成方法、装置与系统,包括:步骤一,为有监督网络输入少量的有监督训练样本,同时为无监督网络输入大量的无监督训练样本,并对无监督文档复制两份,再分别对其嵌入向量进行dropout,得到两组嵌入向量;步骤二,为大型预训练文本生成网络并行集成适配器的小型神经网络,组成基于适配器微调的预训练学习组件;步骤三,对有监督网络与无监督网络采用基于适配器微调预训练学习组件,对无监督网络进行一致性学习,并结合有监督网络的有监督学习进行文本生成模型的训练与优化,并利用优化好的模型进行预测。本发明方案减少了对大量的人工标注数据的依赖,并使得模型训练过程训练开销也大幅降低。
公开/授权文献:
- CN114611472A 一种低资源场景下的文本生成方法、装置及系统 公开/授权日:2022-06-10
IPC结构图谱:
G06F40/166 | 编辑,例如插入或删除 |