首页 > 后端开发 > php教程 > php curl 如何抓取淘宝商品页面?求大神回复。。感觉超难。

php curl 如何抓取淘宝商品页面?求大神回复。。感觉超难。

WBOY
发布: 2016-06-23 14:28:19
原创
1741 人浏览过

这是我写的curl抓取代码,抓取天猫商品也有用。但淘宝商品页却抓不了。

<?php$url = "http://item.taobao.com/item.htm?id=16396503658";$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_TIMEOUT, 20);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);$ret = curl_exec($ch);curl_close($ch);echo $ret;?>
登录后复制

加了CURLOPT_FOLLOWLOCATION也没用。。求大神指导


回复讨论(解决方案)

淘宝描述动态加载 分析一下 取那个地址

怎么分析。。CURLOPT_FOLLOWLOCATION不是会自动跳到最终也没吗

不仅要有跳转,还需要传递 cookie
curl 仅能获取目标页面的 html 代码,并不能执行其中的 js 程序
而该页面的关键数据同时通过 js 产生的

。。。。。我现在连页面都抓不到
怎么存cookie

存储cookie有专门的属性
CURLOPT_COOKIEJAR

我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...

我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

本帖最后由 PhpNewnew 于 2014-02-07 09:05:23 编辑


我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

能打开?我这里是能打开 打开后就是空白.换了个浏览器 IE 的确是可以的...chrome不行 搞笑


我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

HEADER怎么模拟的,求代码。



我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

HEADER怎么模拟的,求代码。
同求

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板