找回密码
 会员注册
查看: 28|回复: 0

Python反爬突破Cloudflare5秒盾的处理

[复制链接]

4

主题

0

回帖

13

积分

新手上路

积分
13
发表于 2024-9-6 22:55:20 | 显示全部楼层 |阅读模式
最近爬一个网站,遇到了个很棘手的问题,网页访问正常,查看网页源码内容能看到想要的信息,但是用python去爬的话就会遇到反爬Cloudflare5秒盾的检测,返回各种比如Justamoment…等等的结果,最后用了两种方法解决1、使用Cloudscraper这个估计是大部分人的解决方法了,毕竟很实用,直接上代码importre#pipinstallcloudscraperimportcloudscraperimporturllib3urllib3.disable_warnings()url='https://www.xxx.com'response=scraper.get(url).textprint(response)123456782、使用curl_cffiimportre#pipinstallcurl_cffifromcurl_cffiimportrequestsimporturllib3urllib3.disable_warnings()url="https://www.xxx.com"response=requests.get(url,impersonate="chrome101").textprint(response)123456789基本上都是几行代码解决,已经适应了很多场景,基本上都能解决问题了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-11 11:34 , Processed in 0.500476 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表