会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 4. 发明公开
    • METHOD FOR TEXT PROCESSING
    • 文本处理方法
    • EP3186804A1
    • 2017-07-05
    • EP14900381.6
    • 2014-11-25
    • Yandex Europe AG
    • MELNIKOV, Ilia Alekseevich
    • G10L13/08
    • G06F17/2264G06F17/274G06F17/2785G06F17/2795G06F17/2818G10L13/08
    • Method for text processing executable at a computing device, comprising appreciating a source phrase comprised of source words; appreciating a target phrase comprised of target words; associating a respective source word feature set with each one of the source words; associating a respective target word feature set with each one of the target words; analyzing source word feature sets and target word feature sets; and based on the analysis, generating one or more phrase transformation rules for transforming the source phrase into the target phrase. Also a server and non-transitory computer-readable medium storing program instructions for carrying out the method.
    • 用于在计算设备处可执行的文本处理的方法,包括:欣赏由源词组成的源词组; 欣赏由目标词组成的目标短语; 将相应源词特征集与每个所述源词关联起来; 将相应的目标词特征集与每个目标词相关联; 分析源词特征集和目标词特征集; 并基于该分析生成一个或多个短语转换规则以将源词组转换为目标短语。 还是存储用于执行该方法的程序指令的服务器和非暂时性计算机可读介质。
    • 5. 发明公开
    • VERFAHREN ZUM ERZEUGEN VON ELEKTRONISCHEN DOKUMENTEN
    • 用于生产电子文档
    • EP3144821A1
    • 2017-03-22
    • EP16189460.5
    • 2016-09-19
    • Sax, Frank
    • Sax, Frank
    • G06F17/24G06F17/22
    • G06F17/243G06F17/2264G06F17/248
    • Bereit gestellt wird ein Computer-implementiertes Verfahren zum Erzeugen eines elektronischen Dokuments in einem vorbestimmten Zielformat, wobei eine Grundstruktur bereitgestellt wird, in die Inhalte des zu erzeugenden elektronischen Dokuments einzufügen sind. Zum Erzeugen des Dokuments werden Eingangselemente bereitgestellt, die Inhalte umfassen, die in die Grundstruktur einzufügen sind. Ferner werden Bausteine bereitgestellt, zumindest eine Zeichenkette in dem Zielformat umfassen. Die Eingangselemente und die Bausteine werden einem Wandler zugeführt, wobei der Wandler für jedes Eingangselement zumindest einen Bausteinen auswählt und aus den Bausteinen und den Eingangselementen Datensegmente erzeugt, die von einem Erzeuger an vorbestimmten Stellen in die Grundstruktur einfügt werden, der als Ergebnis hiervon das elektronische Dokument bereitstellt. Bereit gestellt wird des Weiteren ein Verfahren zum Extrahieren von Inhalten aus einem elektronischen Dokument sowie ein Verfahren zum Wechseln eines Dokumentenformats von einem ersten Format in ein zweites Format.
    • 提供了一种用于在预定的目标格式,其特征在于,提供了一种基本的结构被插入到的内容被产生的电子文档生成的电子文档的计算机实现的方法。 用于创建提供输入元素的文档中包括的基本结构要插入的内容。 此外,提供的块,至少包括:在所述目标格式的字符串。 所述输入元件和所述块被提供给一个转换器,所述转换器在每个输入单元来选择的至少一个模块和从所述块和所述输入元件,其是在地下结构的预定位置生产者的共混物产生的数据段,其结果,电子文档 提供。 提供一种用于从电子文档,以及用于从第一格式改变文档格式为第二格式的方法提取的内容。
    • 6. 发明公开
    • TEMPORAL TRANSLATION GRAMMAR FOR LANGUAGE TRANSLATION
    • TEMPORÄREÜBERSETZUNGSGRAMMATIKZURSPRACHENÜBERSETZUNG
    • EP3123353A1
    • 2017-02-01
    • EP15715033.5
    • 2015-03-20
    • Microsoft Technology Licensing, LLC
    • PROKOFYEV, AndreyCHENNAI, Selvi
    • G06F17/28G06F17/22G06Q10/10G06F17/27
    • G06F17/2872G06F17/2264G06F17/274G06F17/2765G06F17/2775G06N99/005G06Q10/10
    • In language translation and intent understanding scenarios, the automated translation of expressions including temporal elements (e.g., calendar dates, date ranges, times, and durations) may be achieved by an implementation of translation techniques, such as compiled rule sets and/or machine learning recognizers that have been trained with a training set. However, sharing development resources among various implementations may be difficult; e.g., updates that extend a rule set for application of the translation techniques to a new context may be difficult to utilize while updating a machine learning recognizer. Presented herein are techniques for facilitating the development of temporal translation resources by providing a temporal translation grammar, comprising recognition rules that specify the recognition of temporal elements; normalization rules that specify the normalization of recognized temporal elements into normalized temporal elements and temporal intent; and translation rules that translate the normalized temporal elements of an expression into dates in a translated expression.
    • 在语言翻译和意图理解情境中,包括时间元素(例如,日历日期,日期范围,时间和持续时间)的表达的自动翻译可以通过实现翻译技术来实现,诸如编译的规则集和/或机器学习 已经接受过训练的训练的识别器。 然而,在各种实现中共享开发资源可能是困难的; 例如,在更新机器学习识别器的同时,可能难以利用将用于将翻译技术的应用扩展到新上下文的规则集的更新。 这里提出的是通过提供时间转换语法来促进时间翻译资源的开发的技术,包括指定时间元素的识别的识别规则; 将所识别的时间元素归一化到归一化时间元素和时间意图的归一化规则; 以及将表达式的规范化时间元素转换为翻译表达式中的日期的翻译规则。
    • 9. 发明公开
    • COMPUTING DEVICE AND METHOD FOR CONVERTING UNSTRUCTURED DATA TO STRUCTURED DATA
    • 维多利亚革命联合会日内瓦革命日期
    • EP3019973A1
    • 2016-05-18
    • EP14823301.8
    • 2014-07-08
    • Blueprint Sofware Systems Inc.
    • HEAVENRICH, SamCHENG, JerryRONG, RickyXIONG, Chuhan
    • G06F17/00G06F5/00G06F7/00
    • G06F17/2264G06F17/212G06F17/248G06F17/2705G06F17/30569
    • A computing device and method are provided for converting unstructured data to structured data having a predetermined format. The computing device includes a memory storing unstructured data, an input device, a display, and a processor. The processor retrieves the unstructured data, loads parsing rules defining associations between properties of the unstructured data and the predetermined format, and applies the parsing rules to the unstructured data, dividing the unstructured data into sections. The sections contain portions of the unstructured data in fields defined by the predetermined format, and are presented on the display. A template is generated based on the sections, including, for each section, a record identifying the properties of the unstructured data contained in that section, and identifying corresponding fields of the predetermined format and values for those fields. The template is stored, and the sections are stored as structured data.
    • 提供了一种用于将非结构化数据转换成具有预定格式的结构化数据的计算装置和方法。 计算设备包括存储非结构化数据的存储器,输入设备,显示器和处理器。 处理器检索非结构化数据,加载定义非结构化数据的属性与预定格式之间的关联的解析规则,并将解析规则应用于非结构化数据,将非结构化数据划分为多个部分。 这些部分包含由预定格式定义的字段中的非结构化数据的部分,并且显示在显示器上。 基于这些部分生成模板,每个部分包括标识该部分中包含的非结构化数据的属性的记录,以及识别这些字段的预定格式和值的相应字段。 存储模板,并将这些部分存储为结构化数据。
    • 10. 发明公开
    • PROGRAM, DOCUMENT CONVERSION DEVICE, AND DOCUMENT COVERSION METHOD
    • 程序,DOKUMENTENKONVERTIERUNGSVORRICHTUNG UNDKKENENKONVERTIERUNGSVERFAHREN
    • EP2874070A4
    • 2015-12-23
    • EP12880906
    • 2012-07-12
    • FUJITSU LTD
    • OHYAMA SHOGO
    • G06F17/21G06F17/22
    • G06F17/2264G06F17/2241G06F17/2247G06F17/30011G06F17/30914G06Q10/10
    • A document conversion device (1) uses a presentation tree (221) that includes a hierarchical relationship among document items of an XBRL document (41) to detect, from the document items included in a financial report (21), a document item that corresponds to the document item that has a child document item in the XBRL document (41), divides the content of a detection document item that is the detected document item, relates the divided content to a child document item of the document item that corresponds to the detection document item and that is in the XBRL document (41) and, by using the related content and the child document item, converts the financial report (21) into the XBRL document (41). Thus, the document conversion device (1) is capable of correctly mapping a document item of the financial report (21) to an element of the presentation tree (221).
    • 文档转换装置(1)使用包括XBRL文档(41)的文档项目之间的分级关系的呈现树(221),从财务报告(21)中包含的文档中检测对应于 对于在XBRL文档(41)中具有子文档项目的文档项目,划分检测到的文档项目的检测文档项目的内容,将分割的内容与对应于该文档项目的文档项目的子文档项目相关联 检测文件项目,并且在XBRL文件(41)中,并且通过使用相关内容和子文档项目将财务报告(21)转换为XBRL文档(41)。 因此,文档转换装置(1)能够将财务报告(21)的文档项目正确映射到呈现树(221)的元素。