zhurongx 最近的时间轴更新
zhurongx

zhurongx

V2EX 第 53708 号会员,加入于 2014-01-07 20:56:59 +08:00
zhurongx 最近回复了
2014-05-08 11:48:02 +08:00
回复了 lightforce 创建的主题 问与答 面对采集器,有什么好方法防止或者屏蔽采集的吗?
90%的情况下有效的方法:
把速度快,频率高,已经超出人类操作的频率的来源ip进行限制。监控ip访问流量、次数等特性的工具有很多。
剩余10%基本无解的方法:
好的爬虫会有一个ip池,会把请求分散在大量ip服务中转发,隐藏自己速度快频率高的特点,伪装成正常请求。这种情况下,除非你使用限制性逻辑,如积分满多少才可以打开,否则是无解的。
2014-05-05 15:56:59 +08:00
回复了 hyspace 创建的主题 分享创造 Gitblog.io - 简洁的 Github Pages 博客编辑器
卡在Checking if new repo is ready...了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5859 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 02:33 · PVG 10:33 · LAX 18:33 · JFK 21:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.