Home > Backend Development > PHP Tutorial > php curl 如何抓取淘宝商品页面?求大神回复。。感觉超难。

php curl 如何抓取淘宝商品页面?求大神回复。。感觉超难。

WBOY
Release: 2016-06-23 14:28:19
Original
1742 people have browsed it

这是我写的curl抓取代码,抓取天猫商品也有用。但淘宝商品页却抓不了。

<?php$url = "http://item.taobao.com/item.htm?id=16396503658";$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_TIMEOUT, 20);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);$ret = curl_exec($ch);curl_close($ch);echo $ret;?>
Copy after login

加了CURLOPT_FOLLOWLOCATION也没用。。求大神指导


回复讨论(解决方案)

淘宝描述动态加载 分析一下 取那个地址

怎么分析。。CURLOPT_FOLLOWLOCATION不是会自动跳到最终也没吗

不仅要有跳转,还需要传递 cookie
curl 仅能获取目标页面的 html 代码,并不能执行其中的 js 程序
而该页面的关键数据同时通过 js 产生的

。。。。。我现在连页面都抓不到
怎么存cookie

存储cookie有专门的属性
CURLOPT_COOKIEJAR

我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...

我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

本帖最后由 PhpNewnew 于 2014-02-07 09:05:23 编辑


我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

能打开?我这里是能打开 打开后就是空白.换了个浏览器 IE 的确是可以的...chrome不行 搞笑


我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

HEADER怎么模拟的,求代码。



我试了下 http://item.taobao.com/item.htm?id=16396503658 根本打开了就是空白的你想怎么取?
你的商品ID是有问题的...
能打开好不
我已经解决了,是header没有模拟好

HEADER怎么模拟的,求代码。
同求

source:php.cn
Statement of this Website
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
Popular Tutorials
More>
Latest Downloads
More>
Web Effects
Website Source Code
Website Materials
Front End Template