![一种基于规则配置的URL搜索关键词提取的方法及系统](/CN/2016/1/22/images/201610111430.jpg)
基本信息:
- 专利标题: 一种基于规则配置的URL搜索关键词提取的方法及系统
- 申请号:CN201610111430.X 申请日:2016-03-01
- 公开(公告)号:CN105631050B 公开(公告)日:2019-09-17
- 发明人: 毕慧 , 李超 , 郭承青 , 包秀国 , 刘刚 , 朱缓 , 王琦 , 崔佳 , 王鲁华
- 申请人: 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京同辉知识产权代理事务所
- 代理人: 刘洪勋
- 主分类号: G06F16/9535
- IPC分类号: G06F16/9535 ; G06F16/955
The invention discloses a rule-configuration-based method for extracting URL (uniform resource locator) search keywords.The rule-configuration-based method includes: generating rules: analyzing a search URL of a search engine needing support, and extracting features of the search URL to generate the rules; configuring the rules: configuring the rules acquired by analysis in the above step; performing URL filtering: receiving URL data of a third party, and matching the URL data with the configured rules to filter all URL data received; performing keyword processing: when a URL of the third party targets the rules, extracting the search keywords of the URL.By using the method, extraction of search URL keywords of various search engines can be realized quickly through rule configuration, and quick processing of massive URL data is realized, so that powerful support can be provided by using the method in an information safety system or a public opinion system.
公开/授权文献:
- CN105631050A 一种基于规则配置的URL搜索关键词提取的方法及系统 公开/授权日:2016-06-01
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/95 | ..从网上检索 |
------------G06F16/953 | ...查询,例如通过使用网络搜索引擎 |
--------------G06F16/9535 | ....过滤和个性化 |