detail11detail2detail3 提取多个没有类的span元素中的文本 - 使用BeautifulSoup-PHP中文网问答
提取多个没有类的span元素中的文本 - 使用BeautifulSoup
P粉903052556
P粉903052556 2023-09-15 18:03:23
0
2
853

这就是HTML的样子:

detail1 1 detail2 detail3

我需要提取detail2和detail3。

但是使用这段代码,我只能得到detail1。

info = data.find("p", class_ = "details").span.text

我该如何提取所需的项目?

提前感谢!

P粉903052556
P粉903052556

全部回复 (2)
P粉041856955

在你的情况下,选择更具体的元素,即选择所有具有class为number的元素的兄弟元素:

soup.select('span.number ~ span')

示例

from bs4 import BeautifulSoup html='''

detail1 1 detail2 detail3

''' soup = BeautifulSoup(html) [t.text for t in soup.select('span.number ~ span')]

输出

['detail2', 'detail3']
    P粉099145710

    您可以找到所有的并进行普通索引:

    from bs4 import BeautifulSoup html_doc = """\ 

    detail1 1 detail2 detail3

    """ soup = BeautifulSoup(html_doc, "html.parser") spans = soup.find("p", class_="details").find_all("span") for s in spans[-2:]: print(s.text)

    输出结果:

    detail2 detail3

    或者使用 CSS 选择器:

    spans = soup.select(".details span:nth-last-of-type(-n+2)") for s in spans: print(s.text)

    输出结果:

    detail2 detail3
      最新下载
      更多>
      网站特效
      网站源码
      网站素材
      前端模板
      关于我们 免责声明 Sitemap
      PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!