python - 为什么明明我可以访问的网站, urlopen却会报 404: Not Found

Question

有的说是因为代理.我的浏览器倒是经常开着代理, 但是我已经关闭了. 我特意查看了下HTTP报文, 也都是没经过代理的.但还是会出错. 代码: {代码...} python版本: 3.5.1 报错信息:urllib.error.HTTPError: HTTP Error...

大家讲道理 · Answer

我这边在windows下的python 3.5.2是没有问题的。
建议你抓包比较一下和浏览器访问时请求有什么不同。

Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (AMD64)] on win32
>>> 
>>> 
>>> 
>>> import urllib.request
>>> url = "http://news.dbanotes.net/"
>>> req = urllib.request.Request(url)
>>> page = urllib.request.urlopen(req).read()
>>> page
b'

伊谢尔伦 · Answer

这个有可能是你的agent的设置值有关，因为有的网站会检查这个，来防止非浏览器进行爬虫

巴扎黑 · Answer

你把浏览器中的 headers 和 cookies 复制出来，添加到urllib的Request对象中。
模拟浏览器~~

天蓬老师 · Answer

很重要的一个原因，你程序中请求带过去的agen头被对方封了，换下agen头试试吧。

阿神 · Answer

用不着Request 吧，直接urlopen呢

php8，我来也

30分钟学会网站布局

尚观Oracle入门到精通视频教程

你的第一行 UNI-APP 代码

Flutter 从头到应用启动

兄弟连Linux新版视频教程

AXURE 9视频教程（适合产品经理交互产品设计UI）

零基础PS视频教程

16天带你入门UI视频教程

PS技巧和切片技巧视频教程

阿里云环境搭建以及项目上线视频教程

计算机网络概述——程序员必须掌握的基础知识

程序员必备教程——HTTP协议讲解

Websocket视频教程