首页

191问答库 > 爬虫返回403，但是网页却可以访问，怎么伪装爬虫

爬虫返回403，但是网页却可以访问，怎么伪装爬虫

2025-05-16 11:51:01

推荐回答（1个）

回答1：

如果使用lighttpd做Web Server，那么就更简单了。lighttpd的mod_status提供了非常直观的并发连接的信息，包括每个连接的来源IP，访问的URL，连接状态和连接时间等信息，只要检查那些处于handle-request状态的高并发IP就可以很快确定爬虫的来源IP了。
拒绝爬虫请求既可以通过内核防火墙来拒绝，也可以在web server拒绝，比方说用iptables拒绝

相关问答

爬虫返回403，但是网页却可以访问，怎么伪装爬虫

爬虫被403了怎么解决

Python爬虫采集遇到403问题怎么办？

爬虫403怎么解决

访问被拒绝爬虫发起抓取,httpcode返回码是403

python爬虫通过header伪装后依旧403ERROR

如果在一个网站开发程序里编写一段爬虫程序能不能实现将爬虫内容...

用Java写了一个p站的爬虫，但是出现拒绝访问403怎么破

最新问答

昆山欣永誉电子材料有限公司怎么样？

有谁知道北京电视台《谁在说》里的律师嘉宾任占敏律师代理哪方面的案子经验比较丰富？

泉州麦贝瓦贸易有限责任公司怎么样？

30kw柴油发电机组好一些的要多少钱？！

惠州市农产品质量安全监督检测中心怎么样？

怎么用小米商城抢红米手机？

东莞市顶荣金属科技有限公司怎么样？

刚开始做外贸怎么开发客户？

三江南到佛山动车多少钱

为什么最近几年英超球队在欧战上的成绩越来越差？？