提取多个没有类的span元素中的文本 - 使用BeautifulSoup-PHP中文网问答

detail11detail2detail3 提取多个没有类的span元素中的文本 - 使用BeautifulSoup-PHP中文网问答

文章专题学习下载问答编程词典手游最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

提取多个没有类的span元素中的文本 - 使用BeautifulSoup

P粉903052556 2023-09-15 18:03:23

853

这就是HTML的样子：

detail1 1 detail2 detail3

我需要提取detail2和detail3。

但是使用这段代码，我只能得到detail1。

info = data.find("p", class_ = "details").span.text

我该如何提取所需的项目？

提前感谢！

P粉903052556

全部回复 (2)

P粉0418569552023-09-16 15:38:11 2 楼

在你的情况下，选择更具体的元素，即选择所有具有class为number的元素的兄弟元素：

soup.select('span.number ~ span')

示例

from bs4 import BeautifulSoup html=''' detail1 1 detail2 detail3 
''' soup = BeautifulSoup(html) [t.text for t in soup.select('span.number ~ span')]

输出

['detail2', 'detail3']

点赞+0

添加回复

P粉0991457102023-09-16 14:52:27 1 楼

您可以找到所有的并进行普通索引：

from bs4 import BeautifulSoup html_doc = """\  detail1 1 detail2 detail3 
""" soup = BeautifulSoup(html_doc, "html.parser") spans = soup.find("p", class_="details").find_all("span") for s in spans[-2:]: print(s.text)

输出结果：

detail2 detail3

或者使用 CSS 选择器：

spans = soup.select(".details span:nth-last-of-type(-n+2)") for s in spans: print(s.text)

输出结果：

detail2 detail3

点赞+0

添加回复

热门专题

更多>

php8，我来也

30分钟学会网站布局

尚观Oracle入门到精通视频教程

你的第一行 UNI-APP 代码

Flutter 从头到应用启动

兄弟连Linux新版视频教程

AXURE 9视频教程（适合产品经理交互产品设计UI）

零基础PS视频教程

16天带你入门UI视频教程

PS技巧和切片技巧视频教程

阿里云环境搭建以及项目上线视频教程

计算机网络概述——程序员必须掌握的基础知识

程序员必备教程——HTTP协议讲解

Websocket视频教程

示例

输出