php - snoopy爬虫 报错405 Not Allowed
高洛峰
高洛峰 2017-05-16 12:58:40
0
2
586

代码

$httpClass = new Snoopy();
$httpClass->fetch('https://v.qq.com/');
$url = $httpClass->results;
print_r($url);die();

爬取https://www.baidu.com/就一直报405错误

爬取https://v.qq.com/ 是正常运行的

求解答,弄了一下午都没解决

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全員に返信(2)
淡淡烟草味

Baidu にはおそらくクローラーのような設定があるので、それを偽装して UA などを定義する必要があります
参考: http://www.4wei.cn/archives/396

いいねを押す +0
Peter_Zhu

これはスヌーピータイプの問題ではありません。クローラーについてあまり知らないからです。クローラーが存在するので、当然、対クローラー技術も存在します。最も単純なものは、ブラウザ識別子またはリクエスト ヘッダー内のリファラーなどに基づきます。 Baidu や Tencent のような大手 Web サイトは、私たちがデータをクロールすることを望まないため、多くの予防策を講じているはずです。したがって、データをクロールする前に、クローラーの知識を理解することをお勧めします。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!