会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 2. 发明公开
    • METHOD FOR SYSTEMATIC MASS NORMALIZATION OF TITLES
    • VERFAHREN ZUR SYSTEMATISCHEN MASSENNORMALISIERUNG VON TITELN
    • EP3028180A1
    • 2016-06-08
    • EP14831332.3
    • 2014-07-21
    • Workday, Inc.
    • GIVERTS, VladimirSEGAL, Barzel, Cliff
    • G06F17/27
    • G06F17/30303G06F17/2715G06F17/278G06F17/30091G06F17/30528G06F17/3053G06F17/30598G06F17/30705G06F17/3071G06F17/30985G06Q50/01
    • A method for normalizing raw titles to canonical titles is described. The method includes designating a set of canonical titles, generating a set of n-grams for each canonical title, assigning a set of attributes to each n-gram, assigning a set of labels to each of the attributes, and storing the labeled canonical title and labeled n-grams in a database. In some examples, a new title may be mapped to an existing canonical title in the database by generating a set of n-grams for the new title, looking up the n-grams in the database of canonical titles, retrieving the set of labels assigned to n-grams in the database that match n-grams from the new title, and assigning those labels to the corresponding attributes of the new title. The new title may then be mapped to a canonical title on the basis of similarly labeled attributes.
    • 描述了将原始标题规范化为规范标题的方法。 该方法包括指定一组规范标题,为每个标准标题生成一组n-gram,为每个n-gram分配一组属性,为每个属性分配一组标签,以及存储标记的规范标题 并在数据库中标记为n-gram。 在一些示例中,可以通过为新标题生成一组n-gram,查找数据库中的正规标题的n-gram,检索分配的标签集,可以将新的标题映射到数据库中的现有规范标题 在数据库中与新标题匹配n-gram的n-gram,并将这些标签分配给新标题的相应属性。 然后可以基于类似标记的属性将新标题映射到规范标题。
    • 3. 发明公开
    • WORD PAIR ACQUISITION DEVICE, WORD PAIR ACQUISITION METHOD, AND PROGRAM
    • 设备用于分配字对,方法进行分配字对和程序THEREFOR的
    • EP2477125A1
    • 2012-07-18
    • EP10815349.5
    • 2010-09-07
    • National Institute of Information and Communications Technology
    • DE SAEGER, StijnTORISAWA, KentaroKAZAMA, JunichiKURODA, KowMURATA, Masaki
    • G06F17/27G06F17/30
    • G06F17/30707G06F17/2715G06F17/277G06F17/30401
    • Conventionally, it has been impossible to appropriately acquire word pairs having a prescribed relationship. Such word pairs can be appropriately acquired with a word pair acquisition apparatus including: a word class information storage unit in which word class information for specifying a class of a word can be stored; a class pair favorableness degree storage unit in which a class pair favorableness degree indicating the appropriateness of two classes can be stored; a seed pattern storage unit in which can be stored one or more seed patterns used for acquiring two word pairs having a prescribed relationship a word pair acquisition unit that acquires one or more word pairs co-occurring with the seed pattern from the one or more sentence groups; a class pair favorableness degree acquisition unit that acquires a class pair favorableness degree corresponding to one or more word pairs; a score determination unit that uses the class pair favorableness degree to determine a score of each of the word pairs; a word pair selection unit that acquires one or more word pairs having a score that is high enough to satisfy a predetermined condition; and a word pair output unit that outputs the one or more word pairs acquired by the word pair selection unit.
    • 传统上,已经不可能获得具有规定关系适当地字对。 搜索词对可以适当地包括一个单词对取得装置获得:在哪个字类别信息指定的类的词的可以被存储在单词类信息存储单元; 一类对良好度存储单元,其中一类对良好度表示两个类的适当可存储; 在哪一个种子图案存储单元可以存储用于获取具有规定关系的单词对取得单元做了两字对一个或多个种子的图案获取与种子模式的一个或多个单词对同现从所述一个或多个句子 组; 一类对良好度获取单元获取的一类没有对良好度对应于一个或多个词对; 一个得分确定单元的确使用类对良好度确定性矿得分每个单词对的; 单词对选择单元确实具有得分没有高到足以满足预定条件的获取的一个或多个词对; 和单词对输出单元的输出确实由所述单词对选择单元获取的一个或多个单词对。
    • 5. 发明公开
    • Method and arrangement for obtaining an electronic mail service
    • 获得电子邮件服务的方法和安排
    • EP1881419A3
    • 2008-05-07
    • EP07117391.8
    • 2002-07-22
    • Nokia Corporation
    • Syri, JuhaHyötyniemi, Heikki
    • G06F17/27H04L12/58H04L29/08
    • H04L51/26G06F17/2715G06F17/277G06Q10/107H04L51/14H04L51/38H04L67/306
    • The a user interface (UI) residing in a mobile environment, which has a possibility of indicating after reading each message whether or not the message is divergent from the normal/general level as to the importance of the message. Advantageously, the user does not need to do the indication every time when reading the mail. In the interface, after a given mail has been read (or a part of the given mail has been read), there occurs a possibility to choose between two alternatives: interesting or non -interesting. Advantageously, there is not required other extra work from the user. Gradually, a mail agent collects information about what kind of mail the user prefers and does not prefer. The result will be a prearranged list by preference in the incoming mail. Any mail similar to the ones previously indicated as important will appear first to the user. The applied algorithm in the methods and systems is based on statistical analysis of the linguistic contents of the mail.
    • 位于移动环境中的用户界面(UI),在读取每条消息之后,有可能指示消息是否与正常/一般级别不同,以表明消息的​​重要性。 有利地,用户在阅读邮件时不需要做出指示。 在界面中,读取给定的邮件(或读取了给定邮件的一部分)之后,就有可能在两种选择之间进行选择:有趣还是无趣。 有利地,不需要来自用户的其他额外工作。 邮件代理逐渐收集有关用户喜欢和不喜欢的邮件类型的信息。 结果将是传入邮件中预先安排的列表。 任何类似于之前表示为重要的邮件都将首先出现给用户。 方法和系统中的应用算法基于对邮件语言内容的统计分析。
    • 8. 发明公开
    • Dispositif identifiant automatiquement la langue d'un texte
    • System zur automatischen Indentifizierung der Sprache eines Textes
    • EP1431883A1
    • 2004-06-23
    • EP03293114.9
    • 2003-12-11
    • FRANCE TELECOM
    • Heinecke, Johannes
    • G06F17/27G06F17/28
    • G06F17/2715G06F17/275G06F17/2755
    • Après pré-mémorisation de premières chaînes de caractère (PRq, SUq, INq) fréquentes dans des mots des langues et de deuxièmes chaînes de caractère atypiques (ATq) dans les langues, un dispositif identifiant automatiquement la langue d'un texte parmi plusieurs langues (L1-LQ) extrait des mots du texte et constitue toutes les chaînes de caractère (CH) contenues dans chaque mot extrait. Chaque chaîne dans un mot extrait (MT) est comparée aux premières et deuxièmes chaînes d'une langue déterminée (Lq). Lorsque le mot contient (E6) une première chaîne, un score (Sq) de la langue (Lq) augmente (E7) d'un coefficient (CCH) dépendant notamment de la position de la première chaîne dans le mot. Lorsque le mot contient (E8) une deuxième chaîne, le score diminue (E9) d'un coefficient (CAT) associé à la deuxième chaîne. Le plus grand des scores correspondant aux langues prédéterminées identifie (E14) la langue du texte.
    • 该设备具有分析单元,用于分析从文本中提取的单词的链接字符。 确定的语言的每个链都被完成,使得每当在单词中找到链时,与该语言相关联的得分将基于词中相应链的位置增加或减小系数。 比较单元比较分数以确定最大分数,其标识文本。