BeautifulSoup: Gabungkan teks peringkat atas dengan fungsi carian teg klasik?-Soal Jawab Rangkaian PHP Cina

Artikel Topik pembelajaran Muat turun Soal Jawab Kamus Pengaturcaraan Permainan kemas kini terkini

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

BeautifulSoup: Gabungkan teks peringkat atas dengan fungsi carian teg klasik?

P粉471207302 2023-09-15 09:16:45

401

Saya cuba menggunakan BeautifulSoup untuk mengekstrak maklumat daripada blok html berstruktur tidak seragam. Saya sedang mencari cara untuk menggabungkan blok teks antara tag dalam output carian/penapis. Contohnya, daripada html:

 Description Section1  line1
 line2
 line3
 
 Section2 Content2

Saya ingin membuat senarai output yang mengabaikan jenis teg tertentu (ul和li），但捕获顶级未标记文本。我发现的最接近的是.select(':not(ul,li)')或.find_all(['strong'])dalam contoh di atas, tetapi kedua-duanya tidak boleh menangkap kedua-dua teks peringkat atas yang tidak berteg dan pelbagai teg sasaran. Gelagat yang ideal adalah seperti ini:

.find_all(['strong','UNTAGGED'])

menghasilkan output berikut:

[ Description, Section1, Section2, Content2 ]

P粉471207302

membalas semua (1)

P粉9051445142023-09-16 00:38:21 Tingkat 1

Untuk mendapatkan output, anda boleh pilih，然后选择它的next_siblingdahulu.

Contoh

from bs4 import BeautifulSoup html = '''  Description Section1  line1
 line2
 line3
 
 Section2 Content2  ''' soup = BeautifulSoup(html) data = [] for e in soup.select('strong'): data.extend([e,e.next_sibling.strip()]) data

Output

[Description, 'Section1', Section2, 'Content2']

Suka+0

Tambah Balasan

Topik popular

Lagi>

Artikel popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan

Tentang kita Penafian Sitemap: Laman web PHP Cina：Latihan PHP dalam talian kebajikan awam，Bantu pelajar PHP berkembang dengan cepat！

Php8, saya datang juga

Ketahui reka letak tapak web dalam masa 30 minit

Tutorial Video Permulaan Shangguan Oracle kepada Mahir

Baris pertama kod UNI-APP anda

Berkibar dari awal ke pelancaran apl

Tutorial Video Linux Baharu Brother Lian

Tutorial Video AXURE 9 (Sesuai untuk UI Reka Bentuk Produk Interaktif Pengurus Produk)

Tutorial Video PS Kemahiran Asas Sifar

Tutorial video UI 16 hari untuk anda bermula

Tutorial Video Teknik PS dan Teknik Menghiris

Tutorial Video Pembinaan Persekitaran Awan Alibaba dan Pelancaran Projek

Gambaran Keseluruhan Rangkaian Komputer - Pengetahuan Asas yang Perlu Dikuasai Pengaturcara

Tutorial Penting untuk Pengaturcara - Penjelasan Protokol HTTP

Tutorial Video Websocket

Contoh

Output