首页 > 资讯中心 > 专利 > Web 信息抽取方法

Web 信息抽取方法

发布时间:2019年03月27日 分类:专利

Web信息抽取方法属于互联网技术领域。如何才能从冗杂的Web页面中抽取出需要的信息已经成为多数研究者希望解决的问题。Web信息抽取方法:基于特征比较法建立抽取规则的过程中计算结点相似度,具体步骤选择数据项特征,构建数据项特征,计算相似度;深度遍历整个DOM树完成后,就计算出了所有结点的综合相似度S,最终得到综合相似度S最大的结点,就是需要找的相似结点;相似结点对于的内容就是待抽取信息。本文针对互联网上煤矿安全事件信息的特点,提出了面向煤矿安全事件的Web信息抽取方法,为用户提供更加快速、准确的煤矿安全事件信息服务。

CN201610005979-Web信息抽取方法-申请公开.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号