Python怎么爬取Request UR动态api页面数据,怎么下1080P无水印视频...

发布网友发布时间：2022-04-22 20:59

共2个回答

懂视网时间：2022-04-18 05:54

在进行爬虫的时候，经常需要保存视频到本地。通常得先获得视频(.mp4)的下载链接，再设置保存到本地的路径(路径包括最后的命名，

例如：D:/1.mp4)，因此函数传入的参数为url和path。

例子：（推荐学习：Python视频教程）

import os,import requests。
def download_video(url, file_path):
	try:
		headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.3.2.1000 Chrome/30.0.1599.101 Safari/537.36"}
		pre_content_length = 0
		# 循环接收视频数据
		while True:# 若文件已经存在，则断点续传，设置接收来需接收数据的位置 
			if os.path.exists(file_path):
				headers['Range'] = 'bytes=%d-' % os.path.getsize(file_path)
			res = requests.get(url, stream=True, headers=headers)
			content_length = int(res.headers['content-length'])
			# 若当前报文长度小于前次报文长度，或者已接收文件等于当前报文长度，则可以认为视频接收完成
			if content_length < pre_content_length or (os.path.exists(file_path) and os.path.getsize(file_path) >= content_length):
				break
			pre_content_length = content_length
			# 写入收到的视频数据
			with open(file_path, 'ab') as file:
				file.write(res.content)
				file.flush()
				print('receive data，file size : %d total size:%d' % (os.path.getsize(file_path), content_length))
	except Exception as e:
		dic = {'url':url, 'file_path':file_path}
		print("下载失败:", dic)

这里面用到requests和os库，因此需要import os,import requests。

更多Python相关技术文章，请访问Python教程栏目进行学习！

热心网友时间：2022-04-18 03:02

1、第一个问题：下一个的ctime来源于上一个的api返回内容中，所以导致你频繁在重复采集第一个页面数据；

2、第二个问题：高清视频可以下载，但水印是必然存在，因为此处接口未提供无印视频，

3、第三个问题：pep8规范，就是说你那一行编写的太长了，好几千个字符串呢....其实不影响程序运行...