本发明提出一种用于金融仓单风险控制的网络爬虫方法,采用双布隆过滤器关键词匹配,实现对网络爬虫信息中包含货物信息结果的快速筛选;基于分类匹配方式实现对相同类别货物的精准分类,并结合阈值比较规则,实现对新货物类别的自动添加;基于消息机制,实现整个处理过程前后端任务的负载均衡,保证处理过程的可控性和效率最大化,防止局部热点。采用本发明的技术方案,可以实现对金融仓单抵押货物信息的高效爬取和精确筛选。
CN201610465637-一种用于金融仓单风控的网络爬虫方法-申请公开.pdf
上一篇 : 多方助力双创升级 生物医药挑战极限
服务热线(免长话费) 400-1088-466
工作时间:8:30--12:00 13:00-17:30