首页 > 资讯中心 > 专利 > 一种文本挖掘的特征词权重计算方法

一种文本挖掘的特征词权重计算方法

发布时间:2018年08月16日 分类:专利

本发明提供了一种文本挖掘的特征权重计算方法,将文本特征词的向量表征为分布式表达的实数值向量;根据表征特征词的分布式表达实数值向量,计算获取与该特征词关联度较大的特征词集;通过TextRank算法计算特征词的权重时,将两两特征词间的关联度加入到特征值权重的计算中;通过TextRank算法计算与该特征词关联度较大的其他特征词权重,即特征词集,并同样在计算中加入两两特征词间的关联度。采用本发明的技术方案,可以显著提高文本特征词权重的计算准确率,并能应用于文本的特征词抓取,文本分类和文本聚类中。

CN201611020416-一种文本挖掘的特征词权重计算方法-申请公开.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号