会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 4. 发明申请
    • SEARCH-BASED WORD SEGMENTATION METHOD AND DEVICE FOR LANGUAGE WITHOUT WORD BOUNDARY TAG
    • 基于搜索的词语分割方法和用于没有字边界标签的语言的设备
    • WO2008107305A3
    • 2008-11-06
    • PCT/EP2008052051
    • 2008-02-20
    • IBMIBM UKLIU WENQIN YONGWANG XIN JING
    • LIU WENQIN YONGWANG XIN JING
    • G06F17/28
    • G06F17/2863
    • Disclosed are a search-based word segmentation method and device for a language without a word boundarytag. The method includes the steps of: a. providing at least one search engine witha segment of a text including at least one segment; b. searching for the segment through the at least one search engine, and returning search results; and c. selecting a word segmentation approach for the segment in accordance with at least part of the returned search results. The method and device address the problems of word segmentation for a language without a word boundary tag, and thus combat the limitations of the prior art in terms of flexibility, dependence upon coverage of dictionaries, available training data corpuses, processing of a new word, etc.
    • 公开了一种基于搜索的词分割方法和用于没有单词boundarytag的语言的设备。 该方法包括以下步骤:a。 向至少一个搜索引擎提供包括至少一个段的文本的段; 湾 通过至少一个搜索引擎搜索片段,并返回搜索结果; 和c。 根据返回的搜索结果的至少一部分,为片段选择字分割方法。 该方法和装置解决了没有字边界标签的语言的分词问题,从而在灵活性,依赖于词典的覆盖,可用的训练数据语料库,新词的处理等方面来克服现有技术的限制, 等等