首页 > 资讯中心 > 专利 > 一种基于改进的K-Medoids的KNN文本分类方法

一种基于改进的K-Medoids的KNN文本分类方法

发布时间:2019年07月09日 分类:专利

一种基于改进的K-Medoids的KNN文本分类方法,该方法涉及计算机文本数据处理领域;首先将对训练文本集和测试文本集进行预先处理,包括分词,停用词去除,DF特征选择以及向量表示,得到训练文本向量空间和测试文本向量空间;然后进行基于改进的K-Medoids方法的训练样本裁剪,即分别从初始中心点选择和替换中心点搜索策略角度进行优化,并将其运用到训练样本裁剪,得到新的训练文本空间;最后进行KNN分类,定义代表度函数,将其运用到类别属性函数中用于KNN分类,得到最终结果。实验结果表明,与传统KNN方法、基于K-Medoids的KNN方法相比,本发明具有更高的分类精度和分类效率。

CN201510740516-一种基于改进的K-Medoids的KNN文本分类方法-申请公开.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号