Python을 사용하여 HTML 및 액세스 요소를 어떻게 구문 분석할 수 있습니까?-파이썬 튜토리얼-php.cn

Python을 사용하여 HTML 및 액세스 요소를 어떻게 구문 분석할 수 있습니까?

Linda Hamilton

풀어 주다： 2024-12-13 22:27:15

원래의

784명이 탐색했습니다.

How Can I Parse HTML and Access Elements Using Python?

Python으로 HTML 구문 분석

질문:

HTML 요소에 어떻게 액세스하고 조작할 수 있나요? Python 파서를 사용하시나요? Firefox의 "요소 검사" 기능에 표시되는 중첩 구조와 유사한 구조화된 형식으로 태그와 해당 콘텐츠를 가져올 수 있는 모듈이 필요합니다.

답변:

BeautifulSoup

BeautifulSoup 모듈은 인기 있고 강력한 Python 라이브러리입니다. HTML을 파싱하기 위한 것입니다. HTML을 중첩된 데이터 구조로 변환하여 HTML 요소에 쉽게 액세스하고 탐색할 수 있습니다.

예:

제공한 HTML 문서를 구문 분석하려면:

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>

로그인 후 복사

"body" 내의 "container" div 내용을 가져오려면 태그:

print(parsed_html.body.find('div', attrs={'class':'container'}).text)

로그인 후 복사

기타 옵션:

위 내용은 Python을 사용하여 HTML 및 액세스 요소를 어떻게 구문 분석할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!