Description du problème : ValueError : caractère de format « j » (0x6a) non pris en charge à l'index 21
C'est-à-dire la 6ème ligne à partir du bas.jpg Quel est le problème avec j ? ? ?
importer urllib.request
depuis bs4 importer BeautifulSoup
def get_content(url):
html = urllib.request.urlopen(url)
content = html.read().decode('utf-8')
html.close()
return content
def get_image(infos):
soup = BeautifulSoup(info,"lxml")
all_image = soup.find_all('img',class_="BDE_Image") #一个一个保存
x=1
for image in all_image:
print(image)
urllib.request.urlretrieve(image['src'],"C:\Users\jack Lee\s%.jpg" %(x))
x+=1
url = "https://tieba.baidu.com/p/2218566379"
info = get_content(url)
print (info)
get_image(info)
est
%s
, pas s%