Mengambil Kandungan Dijana JavaScript dengan Permintaan Python
Apabila cuba mengekstrak maklumat daripada halaman web menggunakan Permintaan Python, anda mungkin menghadapi cabaran jika kandungan dimuatkan secara dinamik menggunakan JavaScript. Begini cara untuk mengatasi halangan ini:
Memperkenalkan permintaan-html
Modul requests-html memperluaskan keupayaan Permintaan dengan menyepadukan pelaksanaan JavaScript ke dalam permintaan HTTP. Ini membolehkan anda mendapatkan semula kandungan penuh halaman yang diberikan JavaScript.
Menggunakan requests-html
<code class="python">from requests_html import HTMLSession # Create a session that can execute JavaScript session = HTMLSession() # Fetch the page r = session.get('http://www.yourjspage.com') # Execute JavaScript and render the page r.html.render() # Access the rendered content content = r.html.html</code>
Ciri Tambahan
Selain pelaksanaan JavaScript, requests-html juga termasuk pustaka BeautifulSoup, menyediakan anda alat yang berkuasa untuk menghuraikan kandungan HTML:
<code class="python"># Find and retrieve element content element_content = r.html.find('#myElementID').text</code>
Kesimpulan
Memanfaatkan permintaan -html, anda boleh dengan mudah mendapatkan kandungan daripada tapak web yang menggunakan JavaScript untuk penjanaan halaman dinamik. Kemudahan penggunaan dan penyepaduan dengan BeautifulSoup menjadikannya tambahan yang berharga kepada senjata pengikis web Python anda.
Atas ialah kandungan terperinci Bagaimana untuk Mengikis Kandungan Dijana JavaScript dengan Permintaan Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!