发布网友 发布时间:2022-04-25 22:03
共2个回答
热心网友 时间:2022-05-11 00:22
在Python自带的交互式模式下编辑,交互式下,一行只能放一段代码import requests , 这一行要和下面你定义的函数隔开为两段代码
也就是import requests 要按回车键,然后在新的【>>>】开始处再输入你定义的函数代码
一些网页可以用Python的urllib来抓取内容,基本上没有问题
但是有的网页内容在浏览器看到的和抓取的有很大区别,抓取的基本上是框架实质内容没有
比如必应词典,http://dict.bing.com.cn/#good
热心网友 时间:2022-05-11 01:40
代码如下:
>>> import urllib.request
>>> response = urllib.request.urlopen('h)
>>> html = response.read()
>>> print(html.decode('utf-8'))
Python 2.7.10 (default, Oct 23 2015, 18:05:06)
[GCC 4.2.1 Compatible Apple LLVM 7.0.0 (clang-700.0.59.5)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import requests
>>> requests.get('https://www.hu.com')
<Response [200]>
作者:songjian
链接:https://www.hu.com/question/40873205/answer/88620840
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
结果:
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <mole>
print(html.decode('utf-8'))
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte