
基本信息:
- 专利标题: Detecting content-rich text
- 专利标题(中):检测内容丰富的文本
- 申请号:US11038370 申请日:2005-01-19
- 公开(公告)号:US20060161537A1 公开(公告)日:2006-07-20
- 发明人: Einat Amitay , Nadav Har'el
- 申请人: Einat Amitay , Nadav Har'el
- 申请人地址: US NY Armonk
- 专利权人: International Business Machines Corporation
- 当前专利权人: International Business Machines Corporation
- 当前专利权人地址: US NY Armonk
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
A method includes finding content-rich text in a document by identifying areas of narrative in the document. An apparatus includes a detector and a content-rich text indicator. The detector detects linguistic parameters which characterize narrative text in an input document and the content-rich text indicator provides the locations of narrative text in the input document.
摘要(中):
一种方法包括通过识别文档中叙述的区域来在文档中找到内容丰富的文本。 一种装置包括检测器和富含内容的文本指示符。 检测器检测表征输入文档中的叙述文本的语言参数,并且内容丰富的文本指示符在输入文档中提供叙述文本的位置。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F17/00 | 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法 |
--------G06F17/30 | .信息检索;及其数据库结构 |