![基于深度学习模型的复合文本多分类方法及系统](/CN/2021/1/44/images/202110222535.jpg)
基本信息:
- 专利标题: 基于深度学习模型的复合文本多分类方法及系统
- 申请号:CN202110222535.3 申请日:2021-02-27
- 公开(公告)号:CN113011163B 公开(公告)日:2024-10-29
- 发明人: 卜佑军 , 孙嘉 , 陈博 , 张桥 , 王方玉 , 张鹏 , 周锟 , 伊鹏 , 马海龙 , 胡宇翔 , 李锦玲 , 张稣荣 , 路祥雨 , 张进
- 申请人: 中国人民解放军战略支援部队信息工程大学 , 网络通信与安全紫金山实验室
- 申请人地址: 河南省郑州市高新区科学大道62号
- 专利权人: 中国人民解放军战略支援部队信息工程大学,网络通信与安全紫金山实验室
- 当前专利权人: 中国人民解放军战略支援部队信息工程大学,网络通信与安全紫金山实验室
- 当前专利权人地址: 河南省郑州市高新区科学大道62号
- 代理机构: 郑州大通专利商标代理有限公司
- 代理人: 周艳巧
- 主分类号: G06F40/216
- IPC分类号: G06F40/216 ; G06F40/242 ; G06F40/284 ; G06F40/30 ; G06F16/35 ; G06F18/241 ; G06N3/0464 ; G06N3/0442 ; G06N3/047 ; G06N3/08
摘要:
本发明属于自然语言处理技术领域,特别涉及一种基于深度学习模型的复合文本多分类方法及系统,包含:将复合文本转换至词语粒度级的文本表示,对转换后的词语粒度级文本表示进行预处理,并通过词嵌入方法表示为词向量;将词向量作为深度学习模型输入,通过模型CNN卷积层提取文本特征,选取卷积后向量,并保留全局部分序列关联信息,通过模型self‑attention层为文本特征向量附加权重并进行等长向量序列拼接,利用模型LSTM循环层提取文本特征向量;通过模型池化层对文本特征向量进行平均化操作,并利用softmax分类器获取输入的文本类别概率,依据概率大小来获取文本分类结果。本发明可解决复合文本精确多分类问题,满足自然语言文本多分类预测识别的实际应用。
公开/授权文献:
- CN113011163A 基于深度学习模型的复合文本多分类方法及系统 公开/授权日:2021-06-22
IPC结构图谱:
G06F40/216 | 使用统计方法 |