一种基于改进的K-Medoids的KNN文本分类方法,该方法涉及计算机文本数据处理领域;首先将对训练文本集和测试文本集进行预先处理,包括分词,停用词去除,DF特征选择以及向量表示,得到训练文本向量空间和测试文本向量空间;然后进行基于改进的K-Medoids方法的训练样本裁剪,即分别从初始中心点选择和替换中心点搜索策略角度进行优化,并将其运用到训练样本裁剪,得到新的训练文本空间;最后进行KNN分类,定义代表度函数,将其运用到类别属性函数中用于KNN分类,得到最终结果。实验结果表明,与传统KNN方法、基于K-Medoids的KNN方法相比,本发明具有更高的分类精度和分类效率。
CN201510740516-一种基于改进的K-Medoids的KNN文本分类方法-申请公开.pdf
上一篇 : 基于谱聚类改进交叉的复杂网络社区发现方法
下一篇 : 市科技局关于组织申报天津市重点实验室的通知
服务热线(免长话费) 400-1088-466
工作时间:8:30--12:00 13:00-17:30