社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > Python 爬虫返回403错误解决方法

Python 爬虫返回403错误解决方法

伊谢尔伦

发布： 2017-04-29 10:05:50

原创

6596 人浏览过

问题

抓取数据时，通常调试信息是：

DEBUG: Crawled (200) <GET //m.sbmmt.com/> (referer: None)

登录后复制

如果出现

DEBUG: Crawled (403) <GET //m.sbmmt.com/> (referer: None)

登录后复制

表示网站采用了防爬技术anti-web-crawling technique（Amazon所用），比较简单即会检查用户代理（User Agent）信息。

解决方法

在请求头部构造一个User Agent，如下所示：

def start_requests(self):  
    yield Request("//m.sbmmt.com/",  
                  headers={&#39;User-Agent&#39;: "your agent string"})

登录后复制

以上是Python 爬虫返回403错误解决方法的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

Python，403错误

上一篇：学习Python到底能干什么下一篇：python过滤掉字符串数组中某个敏感词

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

php ob缓存介绍以及ob函数详解

2023-03-07 21:36:01
MySQL使用cmd命令修改密码的操作

1970-01-01 08:00:00
javascript如何操作cookie来实现用户登录代码实例详解

1970-01-01 08:00:00
什么是php类？php类的属性详解

2023-03-11 13:22:01
javascript基本函数debounce、poll和once实例用法详解

1970-01-01 08:00:00
php7函数，声明，返回值等新特性介绍

2023-03-11 15:08:02
php array_keys()如何获取数组键名用法详解

2023-03-12 07:44:02
php深入理解刷新缓冲区函数用法

2023-03-11 10:18:01
javascript如何使用函数和返回值用法实例详解

1970-01-01 08:00:00
介绍Django查询数据库时各种种类的排序

1970-01-01 08:00:00

最新问题

403错误怎么解决？

来自于 1970-01-01 08:00:00

0

0

0

phpstudy v8 为什么网站刷新后会出现403错误？

来自于 1970-01-01 08:00:00

0

0

0

javascript - nginx反向代理静态资源403错误?

来自于 1970-01-01 08:00:00

0

0

0

nginx - Tengine报403 Forbidden错误

来自于 1970-01-01 08:00:00

0

0

0

python scrapy爬虫错误

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1437106
php入门教程之一周学会PHP

4296907
JAVA 初级入门视频教程

2665040
小甲鱼零基础入门学习Python视频教程

516531
PHP 零基础入门教程

877303

最新下载

更多>

网站特效

网站源码

网站素材

前端模板