首页 > 资讯中心 > 专利 > 基于组合凸线性感知器的两类文本分类方法

基于组合凸线性感知器的两类文本分类方法

发布时间:2019年02月21日 分类:专利

本发明公开了一种基于组合凸线性感知器的两类文本的分类方法。本发明包括:收集文本数据集,将其划分为训练集和测试集;预处理数据集;提取总词表并统计词频;对训练样本集进行特征选取,得到特征向量表;将数据集中的所有样本特征项赋权值表示成向量;将所有数据降维到低维特征空间,得到组合凸线性感知器最终处理的数据;利用SMA算法构造组合凸线性感知器,从而判断测试样本的类别。本发明结合tf*idf特征提取法和PCA降维方法,使用SMA算法进行两类文本分类,这是首次将组合凸线性感知器应用到文本分类领域,非常具有独创意义。

CN201610083975-基于组合凸线性感知器的两类文本分类方法-申请公开.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号