首页 > 资讯中心 > 专利 > 一种基于多源语义分析的信息检索方法

一种基于多源语义分析的信息检索方法

发布时间:2018年02月11日 分类:专利

摘要:本发明公开一种多源语义分析的信息检索方法,包括:文档的采集及其预处理;利用LDA模型对文档建模,并建立倒排索引;用户初始查询的获取及其预处理;根据查询词项是否为专业医学词汇进行多维度分析并基于WordNet和UMLS me tathesaurus对其加权进行查询扩展;计算查询扩展词集与LDA降维后的文档之间的相似度并按相似度的大小递减排序,提取不低于预设阈值的文档返回给用户。本发明综合WordNet和UMLS me tathesaurus的特点,对初始查询进行多维度分析加权扩展,能够更为精准的理解用户的查询意图,并利用LDA模型对文档集进行建模,分析出词项在隐主题层面对文档的表征能力,提高了用户对文档检索的性能。

CN201610451523-一种基于多源语义分析的信息检索方法.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号