首页 > 资讯中心 > 知识产权工作站 > 大规模文本分类的方法

大规模文本分类的方法

发布时间:2020年11月10日 分类:知识产权工作站

发明名称 ---  大规模文本分类的方法

申请号­CN201510024552.0
申请日20150118
公开(公告)号­CN104598586A
公开(公告)日20150506
IPC分类号G06F17/30; G06K9/62
申请(专利权)人北京工业大学;
发明人赵旭;李建强;桂琪;亢阳阳;孙靖超;田猛;
优先权号
优先权日

摘要 

大规模文本分类的方法涉及计算机领域,为实现兼顾精度的大规模学习,需要通过构建具有最大差异性的多个分类器及实现多个分类器的高效集成决策来实现。该大规模文本分类的方法包括:将文本数据转换为向量数据,分割大规模文本数据集为子集;以分布式计算的方法使用子集训练子分类器;选择分类器;对待测样本进行分类,实现多分类器共同决策。本发明将集成学习框架应用于大规模文本分类上,可以使现有的分类方法适用于大规模文本分类,提高分类效率。

CN102015000024552CN00001045985860APDFZH20150506CN00F.PDF


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号