php - Le robot d'exploration Snoopy signale l'erreur 405 non autorisée

Question

Code $httpClass = new Snoopy();$httpClass-&gt;fetch('https://v.qq.com/');$url = $httpClass-&gt;results;print_r($url);die(); Lors de l'exploration de https://www.baidu.com/, il continue de signaler une erreur 405. L'exploration de https://v.qq.com/ est une opération normale...

淡淡烟草味 · Answer

Baidu a probablement un paramètre de type robot. Vous devez le dissimuler et définir un UA ou quelque chose comme ça
Référence : http://www.4wei.cn/archives/396

.

天蓬老师 · Answer

Ce n'est pas un problème de type Snoopy. C'est parce que vous ne savez pas grand-chose sur les robots d'exploration. Puisqu’il existe des robots, il y aura bien sûr une technologie anti-crawler. Le plus simple est basé sur l'identifiant du navigateur ou le référent dans l'en-tête de la requête, etc. Les grands sites Web comme Baidu et Tencent ne voudront pas que nous explorions les données, ils ont donc dû prendre de nombreuses mesures préventives. Par conséquent, il est recommandé de comprendre les connaissances des robots d’exploration avant d’explorer les données.