会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 8. 发明授权
    • Set similarity selection queries at interactive speeds
    • 以交互式速度设置相似性选择查询
    • US07921100B2
    • 2011-04-05
    • US12006332
    • 2008-01-02
    • Marios HadjieleftheriouAmit ChandelNick KoudasDivesh Srivastava
    • Marios HadjieleftheriouAmit ChandelNick KoudasDivesh Srivastava
    • G06F17/30
    • G06F17/30442
    • The similarity between a query set comprising query set tokens and a database set comprising database set tokens is determined by a similarity score. The database sets belong to a data collection set, which contains all database sets from which information may be retrieved. If the similarity score is greater than or equal to a user-defined threshold, the database set has information relevant to the query set. The similarity score is calculated with an inverse document frequency method (IDF) similarity measure independent of term frequency. The document frequency is based at least in part on the number of database sets in the data collection set and the number of database sets which contain at least one query set token. The length of the query set and the length of the database set are normalized.
    • 包括查询集令牌的查询集和包括数据库集令牌的数据库集之间的相似性由相似性得分确定。 数据库集合属于数据集合集,其中包含可从中检索信息的所有数据库集。 如果相似性得分大于或等于用户定义的阈值,则数据库集合具有与查询集相关的信息。 相似性得分用独立于术语频率的逆文档频率法(IDF)相似性度量计算。 文档频率至少部分地基于数据收集集中的数据库集合的数量以及包含至少一个查询集令牌的数据库集合的数量。 查询集的长度和数据库集的长度被归一化。