python3出现utf-8 codec cant decode bytes in position114-115:invalid continuation byte怎么办
发布网友
发布时间:2022-05-23 14:28
我来回答
共1个回答
热心网友
时间:2023-10-25 02:11
首先检查文件编码是不是utf-8;
如果是utf-8,检查是否有乱码。
这个错误就是说这两个字节的内容无法按utf-8来解码。
比如一些网站页面有部分乱码的问题存在,去掉相应的字节后就好,我是这么解决的:
def _html(url, decode):
html = urlopen(url).read()()
if not decode:
decode = _testencode(html)
while True:
try:
html = html.decode(decode)
break
except (UnicodeDecodeError,) as e:
html = html[:e.args[2]-1] + html[e.args[3]+1:]
return html
这里except 块里动作就是把相应不能解码的内容丢弃。对应文本文件也可以用类似的方法处理。