![一种政务文本自动分拨模型训练方法及装置](/CN/2023/1/80/images/202310400636.jpg)
基本信息:
- 专利标题: 一种政务文本自动分拨模型训练方法及装置
- 申请号:CN202310400636.4 申请日:2023-04-14
- 公开(公告)号:CN116562284B 公开(公告)日:2024-01-26
- 发明人: 徐旭 , 张耀峰 , 张志刚 , 耿智琳 , 张丽丽 , 姚金伶
- 申请人: 湖北经济学院
- 申请人地址: 湖北省武汉市江夏区藏龙岛杨桥湖大道8号
- 专利权人: 湖北经济学院
- 当前专利权人: 湖北经济学院
- 当前专利权人地址: 湖北省武汉市江夏区藏龙岛杨桥湖大道8号
- 代理机构: 北京华清迪源知识产权代理有限公司
- 代理人: 李楠楠
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/216 ; G06F16/35
摘要:
本申请公开了一种政务文本自动分拨模型训练方法及装置,涉及融合政务技术领域,将标注后的政务文本数据进行分词,并生成字符编码向量、文本编码向量和注意力掩码向量后输入到预训练模型中得到每个字符对应的字向量;其中,预训练模型是利用未标注的政务文本数据采用掩码语言模型对原生BERT模型进一步预训练得到的,将[CLS]对应的字向量输入到全连接层中并激活,得到整体语义向量;利用卷积层将整体语义向量连续进行多次下采样,得到不同尺度下的分类结果并通过注意力机制进行融合,根据最终分类结果调整预训练模型,得到最优模型。通过本申请提供的方法训练得到的模型能够高效且准确的自动分拨政务文本,提高了政府的服务质量和效率。
公开/授权文献:
- CN116562284A 一种政务文本自动分拨模型训练方法及装置 公开/授权日:2023-08-08
IPC结构图谱:
G06F40/289 | 短语分析,例如有限状态技术或分块 |