> 백엔드 개발 > PHP 튜토리얼 > 爬虫获取AJax数据问题

爬虫获取AJax数据问题

WBOY
풀어 주다: 2016-07-06 13:52:21
원래의
1782명이 탐색했습니다.

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题
爬虫获取AJax数据问题
图片中的请求的URL,Response的文本类型是json
可当我单独访问这个url的时候却是html
爬虫获取AJax数据问题

求教,怎么获取json数据

回复内容:

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题
爬虫获取AJax数据问题
图片中的请求的URL,Response的文本类型是json
可当我单独访问这个url的时候却是html
爬虫获取AJax数据问题

求教,怎么获取json数据

这个是用header来控制的
爬虫获取AJax数据问题

你把对应的请求头加上就好了。附上我的代码

<code>#coding=utf-8

import requests as RQ

hburl = "http://huaban.com/boards/28195582/?ipva9fpx&max=759391397&limit=20&wfl=1"
heads = {
'Host':"huaban.com",
'Referer':"{http://huaban.com/boards/28195582/",
'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36",
'X-Request':"JSON",
'X-Requested-With':"XMLHttpRequest"
}


print RQ.get(hburl, headers=heads).content</code>
로그인 후 복사

Rerferer是一个常见的用来防止网页被本站之外获取的Header,做爬虫时一定要确保Referer的设置

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿