会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 3. 发明申请
    • Streaming text data mining method & apparatus using multidimensional subspaces
    • 使用多维子空间的流文本数据挖掘方法和装置
    • US20070083509A1
    • 2007-04-12
    • US11246195
    • 2005-10-11
    • Yuan-Jye WuAnne KaoStephen PoteetWilliam FerngRobert Cranfill
    • Yuan-Jye WuAnne KaoStephen PoteetWilliam FerngRobert Cranfill
    • G06F17/30
    • G06F17/30705G06F17/30616
    • A streaming text data comparator performs real-time text data mining on streaming text data. The comparator receives a streaming text data document and generates a vector representation of the term frequencies relating to an existing document collection. The comparator then transforms the term frequency vector into a projection in a precomputed multidimensional subspace that represents the original document collection. The comparator further calculates a relationship value representing the similarities or differences between the vector representation and the subspace, and compares the relationship value to a predetermined threshold to determine whether the streaming text data document is related to the original document collection. If the streaming text data document is related, the streaming text data comparator intercalates the new document into the document collection. If the new document is not related, the comparator may store or delete the unrelated document.
    • 流文本数据比较器在流文本数据上执行实时文本数据挖掘。 比较器接收流文本数据文档并生成与现有文档集合相关的术语频率的向量表示。 比较器然后将术语频率矢量转换成表示原始文档集合的预计算多维子空间中的投影。 比较器还计算表示向量表示和子空间之间的相似性或差异的关系值,并将关系值与预定阈值进行比较,以确定流文本数据文档是否与原始文档集合相关。 如果流文本数据文档相关,则流文本数据比较器将新文档插入到文档集合中。 如果新文档不相关,则比较器可以存储或删除不相关的文档。