![文本的风险识别方法、装置及设备](/CN/2020/1/43/images/202010216591.jpg)
基本信息:
- 专利标题: 文本的风险识别方法、装置及设备
- 申请号:CN202010216591.1 申请日:2020-03-25
- 公开(公告)号:CN111401062A 公开(公告)日:2020-07-10
- 发明人: 周书恒 , 祝慧佳
- 申请人: 支付宝(杭州)信息技术有限公司
- 申请人地址: 浙江省杭州市西湖区西溪路556号8层B段801-11
- 专利权人: 支付宝(杭州)信息技术有限公司
- 当前专利权人: 支付宝(杭州)信息技术有限公司
- 当前专利权人地址: 浙江省杭州市西湖区西溪路556号8层B段801-11
- 代理机构: 北京国昊天诚知识产权代理有限公司
- 代理人: 朱文杰
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F16/35 ; G06N3/04
摘要:
本说明书实施例提供一种文本的风险识别方法、装置及设备,其中,方法包括:标注待进行风险识别的第一文本中各词汇的风险权重,所述风险权重用于表征词汇的风险程度;根据所述第一文本中各词汇的风险权重从所述第一文本中提取至少一个文本片段形成第二文本;每个所述文本片段中词汇的风险权重满足预设权重条件;对所述第二文本采用预先训练得到的文本分类模型进行风险识别,得到所述第二文本的风险识别结果。本说明书实施例的方案,能够在保证文本分类模型处理能力的情况下防止风险漏识,有效提高文本的风险识别效率。
公开/授权文献:
- CN111401062B 文本的风险识别方法、装置及设备 公开/授权日:2023-04-18
IPC结构图谱:
G06F40/289 | 短语分析,例如有限状态技术或分块 |