Python:使用BeautifulSoup提取锚文本
天蓬老师
天蓬老师 2017-04-17 13:08:02
0
2
456

超链接如下:

<a target="_blank" href="http://www.baidu.com"><span id="video_hl">国际足球</span>巴西世界杯</a>

现在,我想提取锚文本:国际足球巴西世界杯
现在的方法:

a = """<a target="_blank" href="http://www.baidu.com"><span id="video_hl">国际足球</span>巴西世界杯</a>"""
    soup = BeautifulSoup("".join(a))
    print soup.contents[0].string

结果输出None,我知道问题出在标签a中还包含其他的标签(span),从而导致出错,不知道怎么实现呢?

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

全員に返信(2)
PHPzhong
from bs4 import BeautifulSoup

html = '<a target="_blank" href="http://www.baidu.com"><span id="video_hl">国际足球</span>巴西世界杯</a>'
soup = BeautifulSoup(html)
print(soup.select('a')[0].text)
いいねを押す +0
迷茫

解决办法:

    a = """<a target="_blank" href="http://www.baidu.com"><span id="video_hl">国际足球</span>巴西世界杯</a>"""
    soup = BeautifulSoup("".join(a))
    print soup.text

注:要使用bs4版本

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!