一种结构扩展的多项式朴素贝叶斯文本分类方法转让专利
申请号 : CN201510366258.8
文献号 : CN105045825B
文献日 : 2018-05-01
发明人 : 蒋良孝 , 王沙沙 , 李超群 , 张伦干
摘要 :
本发明本发明提供了一种结构扩展的多项式朴素贝叶斯文本分类方法,首先以测试文档中出现的每个单词作为父亲节点构建一个一依赖多项式估测器,然后加权平均所有的一依赖多项式估测器来预测测试文档的类别,其中的权值是每个单词的信息增益率。本发明避免了贝叶斯网络的结构学习阶段,从而降低了由于文本数据的高维性带来的时间花销,同时本发明将双条件概率的估计过程推迟到了分类阶段,巧妙地节省了较大的空间开销。本发明不仅改善了多项式朴素贝叶斯文本分类器的分类精度,而且还避免了贝叶斯网络结构学习的时间和空间开销。