会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 3. 发明专利
    • 網頁資料擷取裝置及其網頁資料擷取方法
    • 网页数据截取设备及其网页数据截取方法
    • TW201818268A
    • 2018-05-16
    • TW105135730
    • 2016-11-03
    • 財團法人資訊工業策進會INSTITUTE FOR INFORMATION INDUSTRY
    • 黃奕翔HUANG, I HSIANG邱育賢CHIU, YU SHIAN蕭暉議HSIAO, HUI I
    • G06F17/30
    • 一種網頁資料擷取裝置及其網頁資料擷取方法。網頁資料擷取裝置執行:根據網頁資料之URL之位址關聯性,將網頁資料分為URL群組;自URL群組之網頁資料中挑選第一網頁資料以及第二網頁資料;解析第一網頁資料以及第二網頁資料得網頁節點資料集合;根據網頁節點資料集合之網頁節點資料之XML路徑語言之路徑關聯性以及文字內容之文字關聯性,將網頁節點資料集合之網頁節點資料分為複數網頁節點資料群組;分別計算各網頁節點資料群組之一文字內容總和;根據文字內容總和,判斷網頁節點資料群組之主要網頁節點資料群組;根據主要網頁節點資料群組包含之網頁節點資料之XML路徑語言決定網頁主要內容擷取資訊。
    • 一种网页数据截取设备及其网页数据截取方法。网页数据截取设备运行:根据网页数据之URL之位址关联性,将网页数据分为URL群组;自URL群组之网页数据中挑选第一网页数据以及第二网页数据;解析第一网页数据以及第二网页数据得网页节点数据集合;根据网页节点数据集合之网页节点数据之XML路径语言之路径关联性以及文本内容之文本关联性,将网页节点数据集合之网页节点数据分为复数网页节点数据群组;分别计算各网页节点数据群组之一文本内容总和;根据文本内容总和,判断网页节点数据群组之主要网页节点数据群组;根据主要网页节点数据群组包含之网页节点数据之XML路径语言决定网页主要内容截取信息。