Web クローリング中に HTML 要素を見つけることはできません。この要素はサイト検査ツールに表示されます

Question

この URL からすべてのテーブルのタイトルをクロールしようとしています: https://www.nature.com/articles/s41586-023-06192-4 Web サイトで次の HTML 要素を見つけることができます: Table1PracticalCt–M–Ctanglesこのタイトルをクロールできません

P粉920485285 · Answer

つまり、使用したコードは問題ないようですが、思い浮かぶ問題は、Web サイトが JavaScript または XHR 呼び出しを介してクロールしたい要素を読み込んでいる可能性があるため、リクエストライブラリを使用してリクエストを送信すると、その要素を取得できません。

この問題を解決する方法は、Selenium を使用し、Selenium で Web サイトを開き、ページのソースコードを bs4 にロードして、コードが正常に動作するようにすることです。

注: Web サイト全体がロードされたら、ページのソースコードを bs4 にロードします。この Web サイトのコンテンツを表示するにはログインが必要であるため、Selenium を使用してログイン関数を作成する必要もあります。

php 8、私も来ます

ウェブサイトのレイアウトを 30 分で学ぶ

ビデオチュートリアルに精通したOracleの入門

あなたの最初のUNI-APPコード

ゼロからアプリの起動までフラッター

兄弟連新版Linuxビデオチュートリアル

AXURE 9 ビデオチュートリアル (プロダクトマネージャーのインタラクティブな製品設計 UI に適しています)

基礎能力ゼロ PS ビデオチュートリアル

16日間のUIビデオチュートリアル

PS テクニックとスライステクニックのビデオチュートリアル

アリクラウド環境構築およびプロジェクトオンラインビデオチュートリアル

コンピュータネットワークの概要 - プログラマが身につけるべき基礎知識

プログラマーのための基本チュートリアル - HTTP プロトコルの説明

Websocket ビデオチュートリアル