会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 2. 发明申请
    • APPROACHES FOR THE UNSUPERVISED CREATION OF STRUCTURAL TEMPLATES FOR ELECTRONIC DOCUMENTS
    • 不间断制作电子文件结构模板的方法
    • US20100169311A1
    • 2010-07-01
    • US12346483
    • 2008-12-30
    • ASHWIN TENGLIAravindan RaghuveerKrishna Prasad Chitrapura
    • ASHWIN TENGLIAravindan RaghuveerKrishna Prasad Chitrapura
    • G06F7/06G06F17/30
    • G06F16/951
    • A method and apparatus for creating templates for electronic documents is provided. One or more attributes are extracted, using a seed template, from a first document, such as a web page. A second document that contains a particular attribute, extracted from the first document, is identified. The second document may be in a different cluster than the first document. The second document is annotated, using an extracted attribute, to create an annotated document. The second document is annotated without human intervention. A new template for the annotated document is generated. The new template facilitates extraction of information from the annotated document. The new template may be used to extract additional attributes from all documents in the cluster of documents of which the second document is a member. The process may continue over numerous iterations to generate a large number of templates in an automated fashion.
    • 提供了一种用于创建电子文档模板的方法和装置。 使用种子模板从第一文档(诸如网页)提取一个或多个属性。 识别从第一个文档中提取的包含特定属性的第二个文档。 第二个文档可能位于与第一个文档不同的集群中。 使用提取的属性对第二个文档进行注释,以创建一个带注释的文档。 第二个文件是没有人为干预的注释。 生成注释文档的新模板。 新模板有助于从注释文档中提取信息。 新模板可用于从第二个文档所属文档的集群中的所有文档中提取附加属性。 该过程可以在多次迭代中继续以自动方式生成大量模板。