BeautifulSoup: 최상위 텍스트와 기존 태그 조회 기능을 결합하시겠습니까?-PHP 중국어 네트워크 Q&A

기사 주제 학습 다운로드 Q&A 프로그래밍 사전 게임 최근 업데이트

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

BeautifulSoup: 최상위 텍스트와 기존 태그 조회 기능을 결합하시겠습니까?

P粉471207302

P粉471207302 2023-09-15 09:16:45

0

1

412

BeautifulSoup을 사용하여 균일하지 않은 구조의 HTML 블록에서 정보를 추출하려고 합니다. 검색/필터 출력의 태그 사이에 텍스트 블록을 결합하는 방법을 찾고 있습니다. 예를 들어 HTML에서:

으아악

특정 유형의 태그를 무시하는 출력 목록을 생성하고 싶습니다(위의 예에서는ul和li），但捕获顶级未标记文本。我发现的最接近的是.select(':not(ul,li)')或.find_all(['strong']). 그러나 둘 중 어느 것도 태그가 지정되지 않은 최상위 텍스트와 다양한 대상 태그를 모두 캡처할 수 없습니다. 이상적인 동작은 다음과 같습니다.

으아악

다음과 같은 출력이 생성됩니다.

 Description Section1  line1
 line2
 line3
 
 Section2 Content2

P粉471207302

P粉471207302

모든 응답 (1)

P粉905144514

P粉9051445142023-09-16 00:38:21 1층

출력을 얻으려면 먼저，然后选择它的next_sibling를 선택하면 됩니다.

예

으아아아

출력

으아아아

좋다+0

답글 추가

인기 주제

더>

인기 기사

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿

회사 소개 부인 성명 Sitemap: PHP 중국어 웹사이트：공공복지 온라인 PHP 교육，PHP 학습자의 빠른 성장을 도와주세요！