
基本信息:
- 专利标题: Learning Element Weighting for Similarity Measures
- 专利标题(中):学习元素加权相似度量
- 申请号:US12715417 申请日:2010-03-02
- 公开(公告)号:US20110219012A1 公开(公告)日:2011-09-08
- 发明人: Wen-tau Yih , Christopher A. Meek , Hannaneh Hajishirzi
- 申请人: Wen-tau Yih , Christopher A. Meek , Hannaneh Hajishirzi
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F15/18
摘要:
Described is a technology for measuring the similarity between two objects (e.g., documents), via a framework that learns the term-weighting function from training data, e.g., labeled pairs of objects, to develop a learned model. A learning procedure tunes the model parameters by minimizing a defined loss function of the similarity score. Also described is using the learning procedure and learned model to detect near duplicate documents.
摘要(中):
描述了一种用于通过从训练数据(例如标记的对象对)学习术语加权函数的框架来测量两个对象(例如,文档)之间的相似性的技术,以开发学习的模型。 学习过程通过最小化相似性得分的定义的损失函数来调整模型参数。 还描述了使用学习过程和学习模型来检测近似重复的文档。
公开/授权文献:
- US09183173B2 Learning element weighting for similarity measures 公开/授权日:2015-11-10
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F17/00 | 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法 |
--------G06F17/30 | .信息检索;及其数据库结构 |