首页 > 资讯中心 > 专利 > 一种基于卡方统计的自适应特征选择方法

一种基于卡方统计的自适应特征选择方法

发布时间:2019年05月10日 分类:专利

一种基于卡方统计的自适应特征选择方法,本方法涉及计算机文本数据处理领域,首先进行训练文本集和测试文本集的预处理,包括分词,停用词处理,然后进行基于卡方统计的自适应文本特征选择,定义词频因子和类间方差,将其引入CHI算法,为CHI算法添加合适的比例因子,最后结合经典的KNN算法的评价指标,自动调节比例因子,使改进的CHI适用于不同的语料库,以保证较高的分类准确度。实验结果表明,与传统的CHI方法相比,本发明分别用于平衡语料库和非平衡语料库分类精度均得到提高。

CN201510927759-一种基于卡方统计的自适应特征选择方法-申请公开.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号