问题:
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
解决办法:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url)print(req.apparent_encoding) #获取真实编码req.encoding = "gb2312"print(req.text)
本文共 270 字,大约阅读时间需要 1 分钟。
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url)print(req.apparent_encoding) #获取真实编码req.encoding = "gb2312"print(req.text)
转载于:https://www.cnblogs.com/testlmh/p/8991029.html