社群學習工具庫休閒

繁体中文

首頁 > 後端開發 > Python教學 > python爬蟲怎麼設定請求頭

python爬蟲怎麼設定請求頭

爱喝马黛茶的安东尼

發布： 2019-06-20 14:30:38

原創

2876 人瀏覽過

在請求網頁爬取的時候，輸出的text訊息會出現抱歉，無法存取等字眼，這就是禁止爬取，需要透過反爬機制去解決這個問題。

headers是解決requests請求反爬的方法之一，相當於我們進去這個網頁的伺服器本身，假裝自己本身在爬取資料。

對反爬蟲網頁，可以設定一些headers訊息，模擬成瀏覽器取訪問網站。

python爬蟲怎麼設定請求頭

headers

「Google或火狐瀏覽器，在網頁面上點選：右鍵–檢查；點選更多工具-開發者工具；直接F12亦可。然後再按Fn F5刷新出網頁來顯示元素

有的瀏覽器是點選：右鍵->查看元素，刷新

相關推薦：《Python影片教學》

python爬蟲怎麼設定請求頭

注意：headers中有很多內容，主要常用的就是user-agent 和host，他們是以鍵對的形式展現出來，如果user-agent 以字典鍵對形式作為headers的內容，就可以反爬成功，就不需要其他鍵對；否則，需要加入headers下的更多鍵對形式。

設定

import urllib2
import urllib
values={"username":"xxxx","password":"xxxxx"}
data=urllib.urlencode(values)
url= "https://ssl.gstatic.com/gb/images/v2_730ffe61.png"
user_agent="Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"
referer=&#39;http://www.google.com/&#39;
headers={"User-Agent":user_agent,&#39;Referer&#39;:referer}
request=urllib2.Request(url,data,headers)
response=urllib2.urlopen(request)
print response.read()

登入後複製

以上是python爬蟲怎麼設定請求頭的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

python 爬蟲請求頭

來源：php.cn

上一篇：python怎麼讀取資料夾下一篇：python中lower如何使用

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

新手入門PHP必知的七種資料型

2023-04-08 08:58:01
PHP實作檔案分片上傳的方法

2020-01-17 17:35:14
PHP基於Redis實作輕量級延遲佇列（多執行緒）

2020-01-17 17:19:41
preference欄位在路由表中代表什麼意義

2020-01-14 09:53:53
problem loading acadres.dll resource file是什麼意思

2020-01-14 09:42:06
prettier怎麼設定

2020-01-14 09:22:49
thumbda是什麼文件

2020-01-13 17:18:04
system thread無限重啟怎麼辦

2020-01-13 17:02:44
system pause 怎麼用

2020-01-13 16:53:40
symbol字符167在哪裡

2020-01-13 16:47:08

最新問題

Python/MySQL無法正確持久化整數數據在這裡不需要任何程式碼。我想要保存一個非常長的數字，因為我正在製作一個遊戲，需要保存分數。但是我測試了一下，將分數設定為25000000000，但在mysql中儲存為2147483...

來自於 2024-04-04 19:09:44

0

1

367

使用selenium想要點擊並在類別中定義URL 今天我需要另一個提示。我正在嘗試建立Python/Selenium程式碼，想法是點擊www.thewebsiteIwantoclickon下面是我正在處理的HTML範例。類別ent...

來自於 2024-04-04 14:14:44

0

1

3492

Selenium + Python - 透過execute_script檢查映像我需要使用python中的selenium驗證圖片是否顯示在頁面上。例如，讓我們檢查https://openweathermap.org/頁面左上角的標誌。我使用execute_s...

來自於 2024-04-03 09:32:15

0

1

375

保留前X行，刪除表格行的方法我在MySQLincident_archive中有一個包含數百萬筆記錄的大表，我想按created列對行進行排序，並保留前X行並刪除其餘行，最有效的方法是什麼。到目前為止，我用Py...

來自於 2024-04-01 18:32:54

0

1

347

如何使用 BeautifulSoup 抓取特定的Google天氣文字？如何使用BeautifulSoup在Python中找到課程文本“美國紐約市”？嘗試複製影片進行練習，但不再有效。嘗試在官方文件中找到一些內容，但沒有成功。或者我的get_html_...

來自於 2024-04-01 14:06:14

0

1

308

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板