网页爬虫 - python爬取网络小说中文‘乱码’

Question

python爬取网络小说 中文‘乱码’，因为不知道是否是乱码，所以加了引号 代码如下 # -- coding:utf8 -- from bs4 import BeautifulSoup import requests url = "http://www.cishuge.com/read/0/250/" web_data = re...

巴扎黑 · Answer

web_data.encoding = "gbk"

ringa_lee · Answer

1、看一下别人网站的编码
2、需要转码就转码
参考 https://github.com/bravekingzhang/moveSpider/blob/master/dyspider/html_downloader.py