urllib2.urlopen を使用したユーザー エージェントのカスタマイズ
ダウンロードされた Web ページには、多くの場合、デフォルトのユーザー エージェント文字列が表示されます。ただし、この文字列の変更が重要となるシナリオもあります。この質問はこのニーズを明らかにし、Web ページのダウンロード中にユーザー エージェントを変更する解決策を模索しています。
Python 2.x では、urllib2.urlopen は Web サイトを開いてそのコンテンツを取得するツールとして機能します。応答を利用して、Web ページのソース コードにアクセスしたり、接続を確立したりできます。ただし、urllib2.urlopen のユーザー エージェントのカスタマイズは、すぐにはわかりません。
解決策には、オープナーを手動で構築し、ヘッダーで目的のユーザー エージェントを指定することが含まれます。次に、以下に示すように、この変更されたオープナーを使用して Web ページを開くことができます。
<code class="python">opener = urllib2.build_opener() opener.addheaders = [('User-Agent', 'Mozilla/5.0')] response = opener.open('http://www.stackoverflow.com')</code>
ユーザー エージェント文字列は、RFC 2616 セクション 14.43 に従って大文字であることに注意してください。この変更により、指定されたユーザー エージェントを使用して Web ページがダウンロードされるようになり、要求側クライアントの認識される動作が変更される可能性があります。
以上がPython の urllib2.urlopen でユーザー エージェントをカスタマイズするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。