セッション Cookie を維持するための jsoup の使用
jsoup を使用して Web サイトへの認証を行う場合、複数のページ リクエストにわたってセッション Cookie を維持することが重要です。このアプローチを組み込むことにより、後続のページ リクエストを適切な承認で行うことができます。
ログイン成功後にセッション Cookie を取得するには、次のコード スニペットを利用します。
<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php") .data("username", "myUsername", "password", "myPassword") .method(Method.POST) .execute(); Document doc = res.parse(); String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>
セッションが完了するとCookie が取得されると、後続のページ リクエストにはそれを含める必要があります:
<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage") .cookie("SESSIONID", sessionId) .get();</code>
これらの手順に従うことで、Apache httpclient などの外部ライブラリに頼ることなく、jsoup を効果的に使用して、認証された Web ページから情報を収集できます。
以上がJsoup を使用した Web サイト スクレイピングのセッション Cookie を維持するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。