问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python 爬虫设置代理

发布网友 发布时间:2022-04-28 04:48

我来回答

3个回答

懂视网 时间:2022-04-28 09:10

python用IP代理的方法:首先创建代理ip对象;然后定制一个opener对象;接着urlopen就一直使用这个代理地址;最后发出请求时,就是用到这个代理地址了。

【相关学习推荐:python教程】

python用IP代理的方法:

python使用代理的方法有两种

1.

 1 #先创建代理ip对象
 2 proxy_support = urllib.request.ProxyHandler({'https':'117.64.149.137:808'})
 3 
 4 #定制一个opener对象
 5 opener = urllib.request.build_opener(proxy_support)
 6 
 7 #安装这个opener对象,以后的urlopen就一直使用这个代理地址了
 8 urllib.request.install_opener(opener)
 9 
10 #发出请求时,就是用到这个代理地址了
11 html = urllib.request.urlopen('xxxxxxxxxx').read()

2.

1 #先创建代理ip对象
2 proxy_support = urllib.request.ProxyHandler({'https':'117.64.149.137:808'})
3 
4 #定制一个opener对象
5 opener = urllib.request.build_opener(proxy_support)
6 
7 #这里可以直接使用opener对象发出请求
8 html = opener.open('xxxxxxxxx').read()

示例代码:

 1 import urllib.request
 2 
 3 #这一段三句话是为了请求时带上浏览器标识,因为有的网站看到是爬虫的标识直接返回403
 4 #请求的网站不涉及到提交数据,所以没有给出data参数
 5 url = 'https://whatismyipaddress.com/'
 6 header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}
 7 req = urllib.request.Request(url,headers=header)
 8 
 9 #使用代理和还原不使用代理的方法
10 #if语句相当于一个开关,不要写成True
11 use_proxy = urllib.request.ProxyHandler({'https':'117.64.149.137:808'})
12 null_proxy = urllib.request.ProxyHandler()
13 if True:
14 opener = urllib.request.build_opener(use_proxy)
15 else:
16 opener = urllib.request.build_opener(null_proxy)
17 #根据上面的开关,安装的opener对象是否带有代理地址
18 urllib.request.install_opener(opener)
19 
20 #获取返回结果
21 #同时可以使用html = opener.open(req).read()获取结果
22 html = urllib.request.urlopen(req).read()
23 
24 #这网页返回页面的内容太多,在控制台不好查看,
25 #并且返回的内容是二进制格式,可以直接写入文件,当个网页查看
26 with open('E:whatismyip.html','wb') as file:
27 file.write(html)
28 print('OK')

想了解更多相关学习,敬请关注php培训栏目!

热心网友 时间:2022-04-28 06:18

#coding:utf-8import urllib2def url_user_agent(url):    #设置使用代理
   proxy = {'http':'27.24.158.155:84'}
   proxy_support = urllib2.ProxyHandler(proxy)    # opener = urllib2.build_opener(proxy_support,urllib2.HTTPHandler(debuglevel=1))
   opener = urllib2.build_opener(proxy_support)
   urllib2.install_opener(opener)    #添加头信息,模仿浏览器抓取网页,对付返回403禁止访问的问题
   # i_headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
   i_headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.48'}
   req = urllib2.Request(url,headers=i_headers)
   html = urllib2.urlopen(req)
if url == html.geturl():
       doc = html.read()        return doc
return

url = 'search/category/2/10/g311'doc = url_user_agent(url)print doc

热心网友 时间:2022-04-28 07:36

现在市面上已经很多代理软件了,个人感觉那些打着免费的口号的一些“莆田系”代理就不要考虑了,基本上不能用。我用的618Ip代理软件,他们的ip资源还挺多的,基本是满足了我工作上的需求,线路相较于国内其他一些同类软件已经是很好了。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
初一语文同步练习册68页第3题的作文! 是什么? 高一语文68页续写作文, 很久以前,在很远的地方,有个老头儿………_百度... 语文必修一68页写作练习的作文!800字、急求!。 涉嫌强奸罪但证据不足最长拘留多久 嗓子疼可以喝柠檬吗 喝柠檬水上火么?网上都说不上火,可为什么喝完柠檬水一觉起来嗓子... 三清茶功效原理 瑶寨三清茶 三清茶如何 如何判断三清茶的品质? PHP:这个结果是如何替换出来的?求解 php 多维数组中整体修改键名 centos 6.0使用yum命令在线安装的php安装在哪个目录 centos7 yum安装php7 怎么指定安装目录 centos 安装php怎么选择版本 linux centos 7 下用yum 安装iso镜像里自带的php5.4.16版本的但是没有php-fqm文件不知道怎么重启php服务 yum 安装php怎么启动失败 如何在centos 系统中通过yum方式升级php到最新版本 用yum安装php-fpm提示There are no enabled repos. centos 如何安装最新php PHP 5.3.3之后php-fpm就整合了,怎么通过yum安装PHP的时候开启php-fpm 如何解除改变phpmyadmin数据库导入文件大小 如何在wordpress上增加文件上传的大小限制 如何设置apache+php的上传文件大小上限 phpmyadmin数据库导入文件大小限制怎么改? php中,怎么解决导入数据库时,文件大小的限制 怎么修改PHP的最大 传输限制? python 如何存贮千万之上的数据 python爬取到数据后通过pandas保存,但全都保存在一个单元格,有什么方法能分行分列保存? python保存数据有问题,求帮忙 python 异步请求的时候怎么添加代理 做人工智能为什么用Python? python为什么适合用于人工智能 Python与人工智能的关系 Python <<运算符什么意思?干什么用? Python :=海象运算符最简单的解释? 使用Python 制作对比图片相似度的程序怎么比较? python如何进行图像比对 如何使用python来判断图片相似度 python的pil模块怎么判断图片是否相同 如何用Python计算上几百张图片之间的相似度? 如何用Python和深度神经网络寻找相似图像 请教各位大神,如何用python提取出两幅图像中不同的部分 python 判断图像是彩色图像还是灰度图像 python的类中不同变量之间的比较和区别.问题由百度上常用例子引出,具体问题见图片和补充描述。 python用picamera和opencv获得图像有什么不同 Python编码声明都有哪几种写法,utf python 声明编码 源代码文件有编码格式,还有#coding的编码声明,还有默认的ASCII,Python对这些编码是怎样一个处理过程? python编码声明可以位于文件的任何位置,对吗?