![一种基于网站特征的贷款类诈骗网站的识别方法](/CN/2020/1/106/images/202010532225.jpg)
基本信息:
- 专利标题: 一种基于网站特征的贷款类诈骗网站的识别方法
- 申请号:CN202010532225.7 申请日:2020-06-12
- 公开(公告)号:CN111680220A 公开(公告)日:2020-09-18
- 发明人: 马敏燕 , 沈颖彦 , 张震 , 陈形 , 王蓓 , 陈浏天 , 胡少杰 , 陈恒超 , 仇晨悦 , 季莹莹 , 马骏野
- 申请人: 国家计算机网络与信息安全管理中心浙江分中心
- 申请人地址: 浙江省杭州市解放路178号
- 专利权人: 国家计算机网络与信息安全管理中心浙江分中心
- 当前专利权人: 国家计算机网络与信息安全管理中心浙江分中心
- 当前专利权人地址: 浙江省杭州市解放路178号
- 代理机构: 北京金蓄专利代理有限公司
- 代理人: 许秀惠
- 主分类号: G06F16/9535
- IPC分类号: G06F16/9535 ; G06F16/35 ; G06F40/289 ; G06F40/126 ; H04L29/12
摘要:
本发明提供一种基于网站特征的贷款类诈骗网站的识别方法,包括:识别IP归属地,并筛选出IP地址为非中国大陆的网站;对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;在筛选出的手机端的网站中再筛选出有中文编码的网站;对筛选出有中文编码的网站的文案字符进行分词;利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;筛选出权重较高的网站。针对同类型不同网站的共同特征,针对贷款类诈骗网站,本发明形成了成熟的识别模型,可以快速、准确、有效的从大量网站中识别出贷款类诈骗网站,主动发现可能让网民蒙受损失的贷款类诈骗网站,为充分、及时的打击贷款类网络诈骗提供有效的支持。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/95 | ..从网上检索 |
------------G06F16/953 | ...查询,例如通过使用网络搜索引擎 |
--------------G06F16/9535 | ....过滤和个性化 |