发布网友 发布时间:2022-04-25 17:17
共5个回答
懂视网 时间:2022-04-06 04:03
python写代理ip的方法:首先创建代理ip对象,并定制一个opener对象;然后安装opener对象,以后的urlopen就一直使用这个代理地址。
python写代理ip的方法:
方法1:
先创建代理ip对象
proxy_support = urllib.request.ProxyHandler({'https':'117.64.149.137:808'})
定制一个opener对象
opener = urllib.request.build_opener(proxy_support)
安装这个opener对象,以后的urlopen就一直使用这个代理地址了
urllib.request.install_opener(opener)
发出请求时,就是用到这个代理地址了
html = urllib.request.urlopen('xxxxxxxxxx').read()
方法2:
先创建代理ip对象
proxy_support = urllib.request.ProxyHandler({'https':'117.64.149.137:808'})
定制一个opener对象
opener = urllib.request.build_opener(proxy_support)
这里可以直接使用opener对象发出请求
html = opener.open('xxxxxxxxx').read()
示例代码:
import urllib.request #这一段三句话是为了请求时带上浏览器标识,因为有的网站看到是爬虫的标识直接返回403 #请求的网站不涉及到提交数据,所以没有给出data参数 url = 'https://whatismyipaddress.com/' header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'} req = urllib.request.Request(url,headers=header) #使用代理和还原不使用代理的方法 #if语句相当于一个开关,不要写成True use_proxy = urllib.request.ProxyHandler({'https':'117.64.149.137:808'}) null_proxy = urllib.request.ProxyHandler() if True: opener = urllib.request.build_opener(use_proxy) else: opener = urllib.request.build_opener(null_proxy) #根据上面的开关,安装的opener对象是否带有代理地址 urllib.request.install_opener(opener) #获取返回结果 #同时可以使用html = opener.open(req).read()获取结果 html = urllib.request.urlopen(req).read() #这网页返回页面的内容太多,在控制台不好查看, #并且返回的内容是二进制格式,可以直接写入文件,当个网页查看 with open('E:whatismyip.html','wb') as file: file.write(html) print('OK')
相关免费学习推荐:python教程(视频)
热心网友 时间:2022-04-06 01:11
第一步:找IP资源
IP资源并不丰富,换句话说是供不应求的,因此一般是使用动态IP。
免费方法,直接在网络上找,在搜索引擎中一搜索特别多能够提供IP资源的网站,进行采集即可。
付费方法,通过购买芝麻ip上的IP资源,并进行提取,搭建IP池。
第二步,检测可用IP保存。提取到的IP,可以进一步进行检测是否可用,比如访问某个固定的网站,找出访问成功的IP进行保存。
第三步,随机调用IP
在爬虫需要使用IP时,可用读取保存IP的文件,进行随机调用IP。
本文介绍了如何建爬虫的IP池方法,可以说搭建IP池很容易,可有些IP的时效性很短,使用之前还可以再测试一次的。
热心网友 时间:2022-04-06 02:29
工作关系,我也偶尔需要使用VPN更换一下IP,这时候我一般是用双鱼IP转换器,是碰巧在网上找到的,给我的感觉是比较简单,一看就懂 因为登陆软件之后一共才2个操作键,连接和断开,只需要按自己需要的地区选下城市就可以了,希望能帮到你吧!热心网友 时间:2022-04-06 04:03
使用618动态IP地址就可以,电信ADSL每次拨号就会更换一个IP,可以按这个思路去做。热心网友 时间:2022-04-06 05:55
为了突破次数的*就可以使爬虫更高效的工作,代理IP是突破次数*,提高爬虫高效工作的最好的工具。所以,很多人都想通过建立IP池的方法,实现换IP突破*,那么这IP池如何进行搭建,接下来IPIDEA全球http简单的给大家讲讲如何搭建一个代理IP池。