首页 > 资讯中心 > 专利 > 一种基于流式计算的金融仓单风控信息爬取和筛选方法

一种基于流式计算的金融仓单风控信息爬取和筛选方法

发布时间:2018年02月11日 分类:专利

摘要:本发明公开一种基于流式计算的金融仓单风险信息爬取和筛选方法,基于流式计算技术将爬虫过程解耦为6个子过程:URL筛选、页面分析、关键词过滤、数值过滤、特征向量匹配过滤、资源更新。采用本发明的技术方案,以解决传统方法在并行爬虫方面实时性较低,金融仓单风控对货物估值实时性要求高的问题。

CN201610465640-一种基于流式计算的金融仓单风控信息爬取和筛选方法.pdf


分享到

服务热线(免长话费)  400-1088-466
工作时间:8:30--12:00 13:00-17:30

海天缘微信
Copyright © 天津海天缘科技发展有限公司 All Rights Reserved
《中华人民共和国电信与信息服务业务经营许可证》编号:津ICP备08002280号