84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
超链接如下:
国际足球巴西世界杯
现在,我想提取锚文本:国际足球巴西世界杯现在的方法:
a = """国际足球巴西世界杯""" soup = BeautifulSoup("".join(a)) print soup.contents[0].string
结果输出None,我知道问题出在标签a中还包含其他的标签(span),从而导致出错,不知道怎么实现呢?
欢迎选择我的课程,让我们一起见证您的进步~~
from bs4 import BeautifulSoup html = '国际足球巴西世界杯' soup = BeautifulSoup(html) print(soup.select('a')[0].text)
解决办法:
a = """国际足球巴西世界杯""" soup = BeautifulSoup("".join(a)) print soup.text
注:要使用bs4版本
解决办法:
注:要使用bs4版本