urllib2.urlopen으로 사용자 에이전트 사용자 정의
다운로드된 웹페이지에는 기본 사용자 에이전트 문자열이 표시되는 경우가 많습니다. 그러나 이 문자열을 수정하는 것이 중요한 시나리오가 있습니다. 질문은 이러한 필요성을 드러내고 웹페이지 다운로드 중에 사용자 에이전트를 변경하는 솔루션을 모색합니다.
Python 2.x에서 urllib2.urlopen은 웹사이트를 열고 해당 콘텐츠를 검색하는 도구 역할을 합니다. 응답을 활용하여 웹페이지의 소스 코드에 액세스하거나 연결을 설정할 수 있습니다. 그러나 urllib2.urlopen에 대한 사용자 에이전트를 사용자 정의하는 것은 즉시 명확하지 않습니다.
해결 방법은 오프너를 수동으로 구성하고 헤더에 원하는 사용자 에이전트를 지정하는 것입니다. 그런 다음 이 수정된 오프너를 사용하여 아래와 같이 웹페이지를 열 수 있습니다.
<code class="python">opener = urllib2.build_opener() opener.addheaders = [('User-Agent', 'Mozilla/5.0')] response = opener.open('http://www.stackoverflow.com')</code>
사용자 에이전트 문자열은 RFC 2616 섹션 14.43에 따라 대문자로 표시됩니다. 이렇게 수정하면 웹페이지가 지정된 사용자 에이전트와 함께 다운로드되어 요청 클라이언트의 인식된 동작이 변경될 수 있습니다.
위 내용은 Python의 urllib2.urlopen에서 사용자 에이전트를 사용자 정의하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!