Detaillierte Erläuterung der Verwendung des Requests-Moduls von Python-Python-Tutorial-php.cn

Das Requests-Modul ist ein Modul, das für den Netzwerkzugriff verwendet wird. Tatsächlich gibt es viele ähnliche Module, wie z. B. urllib, urllib2, httplib, httplib2. Sie bieten grundsätzlich ähnliche Funktionen. Warum kann das Requests-Modul hervorstechen? Sie können die offizielle Website öffnen und einen Blick darauf werfen. Es handelt sich um ein http-Modul für „Menschen“. Wie menschlich ist es also? Ich glaube, wenn Sie schon einmal Module wie urllib verwendet haben, werden Sie feststellen, dass es tatsächlich sehr benutzerfreundlich ist.

1. Importieren

Nach Abschluss des Downloads ist der Import des Moduls wie folgt:

import requests

Nach dem Login kopieren

2. URL anfordern

Hier listen wir die gebräuchlichste Syntax zum Senden von Get- oder Post-Anfragen auf.

1. Senden Sie eine Get-Anfrage ohne Parameter:

r=requests.get("//m.sbmmt.com/justTest")

Nach dem Login kopieren

Jetzt erhalten wir ein Antwortobjekt r, wir können dieses Objekt verwenden, um alle gewünschten Informationen abzurufen.

Im obigen Beispiel hat die Get-Anfrage keine Parameter. Was ist, wenn die Anfrage Parameter erfordert?

2. Senden Sie eine Get-Anfrage mit Parametern

payload = {&#39;key1&#39;: &#39;value1&#39;, &#39;key2&#39;: &#39;value2&#39;}
r = requests.get("//m.sbmmt.com/justTest", params=payload)

Nach dem Login kopieren

Wie wir aus dem oben Gesagten wissen, werden unsere Get-Parameter als params-Schlüsselwortparameter übergeben.

Wir können die angeforderte spezifische URL ausdrucken, um zu sehen, ob sie korrekt ist:

>>>print r.url
//m.sbmmt.com/justTest?key2=value2&key1=value1

Nach dem Login kopieren

Sie können sehen, dass tatsächlich auf die richtige URL zugegriffen wurde.

Sie können auch eine Liste an einen Anforderungsparameter übergeben:

>>> payload = {&#39;key1&#39;: &#39;value1&#39;, &#39;key2&#39;: [&#39;value2&#39;, &#39;value3&#39;]}
>>> r = requests.get("//m.sbmmt.com/justTest", params=payload)
>>> print r.url
//m.sbmmt.com/justTest?key1=value1&key2=value2&key2=value3

Nach dem Login kopieren

Das Obige ist die Grundform der Get-Anfrage.

3. Senden Sie eine Post-Anfrage

r = requests.post("//m.sbmmt.com/postTest", data = {"key":"value"})

Nach dem Login kopieren

Wie Sie oben sehen können, werden die Post-Anfrageparameter als Datenschlüsselwortparameter übergeben.

Der aktuelle Datenparameter übergibt ein Wörterbuch. Wir können auch Daten im JSON-Format wie folgt übergeben:

>>> import json
>>> import requests
>>> payload = {"key":"value"}
>>> r = requests.post("//m.sbmmt.com/postTest", data = json.dumps(payload))

Nach dem Login kopieren

Da es zu üblich ist, Daten im JSON-Format im Modul „Anfragen“ zu senden In der höheren Version wurde der Schlüsselwortparameter json hinzugefügt. Sie können JSON-Daten direkt an die Post-Anfrage senden, ohne das JSON-Modul zu verwenden:

>>> payload = {"key":"value"}
>>> r = requests.post("//m.sbmmt.com/postTest", json=payload)

Nach dem Login kopieren

Was ist, wenn wir eine Datei veröffentlichen möchten? ? Zu diesem Zeitpunkt müssen Sie den Dateiparameter verwenden:

>>> url = &#39;//m.sbmmt.com/postTest&#39;
>>> files = {&#39;file&#39;: open(&#39;report.xls&#39;, &#39;rb&#39;)}
>>> r = requests.post(url, files=files)
>>> r.text

Nach dem Login kopieren

Wir können beim Posten der Datei auch zusätzliche Informationen wie den Dateinamen angeben:

>>> url = &#39;//m.sbmmt.com/postTest&#39;
>>> files = {&#39;file&#39;: (&#39;report.xls&#39;, open(&#39;report.xls&#39;, &#39;rb&#39;), &#39;application/vnd.ms-excel&#39;, {&#39;Expires&#39;: &#39;0&#39;})}
>>> r = requests.post(url, files=files)

Nach dem Login kopieren

Tipps: Das ist es Es wird dringend empfohlen, den Binärmodus zu verwenden. Öffnen Sie die Datei, denn wenn Sie sie im Textdateiformat öffnen, kann aufgrund des Headers „Content-Length“ ein Fehler auftreten.

Wie Sie sehen, ist das Senden von Anfragen mit Requests einfach!

3. Erhalten Sie die Rücksendeinformationen

Schauen wir uns an, wie Sie die Rücksendeinformationen nach dem Absenden der Anfrage erhalten. Verwenden wir weiterhin das obere Beispiel:

>>> import requests
>>> r=requests.get(&#39;//m.sbmmt.com/justTest&#39;)
>>> r.text

Nach dem Login kopieren

In welchem Kodierungsformat wird r.text ausgegeben?

>>> r.encoding
&#39;utf-8&#39;

Nach dem Login kopieren

wurde ursprünglich im UTF-8-Format ausgegeben. Was ist, wenn ich das Ausgabeformat von r.text ändern möchte?

>>> r.encoding = &#39;ISO-8859-1&#39;

Nach dem Login kopieren

Dadurch wird das Ausgabeformat auf „ISO-8859-1“ geändert.

Es gibt auch eine Ausgabeanweisung namens r.content. Was ist also der Unterschied zwischen dieser und r.text? r.content gibt einen Byte-Stream zurück, der verwendet werden kann, wenn wir eine Bildadresse anfordern und das Bild speichern möchten. Hier ist ein Codeausschnitt wie folgt:

def saveImage( imgUrl,imgName ="default.jpg" ):
    r = requests.get(imgUrl, stream=True)
    image = r.content
    destDir="D:\"
    print("保存图片"+destDir+imgName+"\n")
    try:
        with open(destDir+imgName ,"wb") as jpg:
            jpg.write(image)     
            return
    except IOError:
        print("IO Error")
        return
    finally:
        jpg.close

Nach dem Login kopieren

Der gerade eingeführte r.text gibt Folgendes zurück: eine Zeichenfolge. Wenn die der Anfrage entsprechende Antwort ein JSON ist, kann ich die Daten dann direkt im JSON-Format abrufen? r.json() ist dafür vorbereitet.

Wir können auch die vom Server zurückgegebenen Originaldaten erhalten, indem wir einfach r.raw.read() verwenden. Wenn Sie jedoch wirklich die ursprünglichen Rückgabedaten erhalten möchten, denken Sie daran, bei der Anfrage die Option „stream=True“ hinzuzufügen, z. B.:

r = requests.get(&#39;https://api.github.com/events&#39;, stream=True)。

Nach dem Login kopieren

Wir können auch den Antwortstatuscode abrufen:

>>> r = requests.get(&#39;//m.sbmmt.com/justTest&#39;)
>>> r.status_code
200

Nach dem Login kopieren

Sie können request.codes.ok auch verwenden, um auf den Rückgabewert von 200 zu verweisen:

>>> r.status_code == requests.codes.ok
True

Nach dem Login kopieren

4. Bezüglich Header

Wir können den Antwortheader ausdrucken :

>>> r= requests.get("//m.sbmmt.com/justTest")
>>> r.headers

Nach dem Login kopieren

｀r.headers｀ gibt ein Wörterbuch zurück, zum Beispiel:

{
    &#39;content-encoding&#39;: &#39;gzip&#39;,
    &#39;transfer-encoding&#39;: &#39;chunked&#39;,
    &#39;connection&#39;: &#39;close&#39;,
    &#39;server&#39;: &#39;nginx/1.0.4&#39;,
    &#39;x-runtime&#39;: &#39;147ms&#39;,
    &#39;etag&#39;: &#39;"e1ca502697e5c9317743dc078f67693a"&#39;,
    &#39;content-type&#39;: &#39;application/json&#39;
}

Nach dem Login kopieren

Wir können die folgende Methode verwenden, um einige Antwortheader zur Beurteilung zu erhalten:

r.headers[&#39;Content-Type&#39;]

Nach dem Login kopieren

Oder

r.headers.get(&#39;Content-Type&#39;)

Nach dem Login kopieren

Was ist, wenn wir den Anforderungsheader (d. h. die Header-Informationen, die wir an den Server senden) erhalten möchten? Kann direkt über r.request.headers abgerufen werden.

Gleichzeitig können wir beim Anfordern von Daten auch benutzerdefinierte Header (durch Header-Schlüsselwortparameter übergeben) hinzufügen:

>>> headers = {&#39;user-agent&#39;: &#39;myagent&#39;}
>>> r= requests.get("//m.sbmmt.com/justTest",headers=headers)

Nach dem Login kopieren

5 Über Cookies

Wenn a Antwort Cookies enthält, können wir die folgende Methode verwenden, um sie abzurufen:

>>> url = &#39;//m.sbmmt.com&#39;
>>> r = requests.get(url)
>>> r.cookies[&#39;example_cookie_name&#39;]
&#39;example_cookie_value&#39;

Nach dem Login kopieren

Wir können auch unsere eigenen Cookies senden (unter Verwendung des Schlüsselwortparameters Cookies):

>>> url = &#39;//m.sbmmt.com/cookies&#39;
>>> cookies={&#39;cookies_are&#39;:&#39;working&#39;}
>>> r = requests.get(url, cookies=cookies)

Nach dem Login kopieren

6. Über Umleitung

Manchmal, wenn wir eine URL anfordern, leitet der Server unsere Anfrage automatisch um. Beispielsweise leitet Github unsere http-Anfrage auf eine https-Anfrage um. Wir können r.history verwenden, um Weiterleitungen anzuzeigen:

>>> r = requests.get(&#39;//m.sbmmt.com/&#39;)
>>> r.url
&#39;http://pythontab.com/&#39;
>>> r.history
[]

Nach dem Login kopieren

Wie Sie im obigen Beispiel sehen können, verwenden wir das http-Protokoll für den Zugriff, aber in r.url wird das https-Protokoll gedruckt. Was soll ich also tun, wenn ich darauf bestehe, dass der Server das http-Protokoll verwendet, was bedeutet, dass dem Server die automatische Umleitung untersagt ist? Verwenden Sie den Parameter „allow_redirects“:

r = requests.get(&#39;//m.sbmmt.com&#39;, allow_redirects=False)

Nach dem Login kopieren

7. Über die Anfragezeit

Wir können den Timeout-Parameter verwenden, um das Anfrage-Timeout der URL festzulegen (Zeiteinheit ist Sekunden):

requests.get(&#39;//m.sbmmt.com&#39;, timeout=1)

Nach dem Login kopieren

8. Informationen zum Proxy

Wir können im Programm auch einen Proxy für den http- oder https-Zugriff angeben (mithilfe der Schlüsselwortparameter „proxies“), wie folgt:

proxies = {
  "http": "http://10.10.1.10:3128",
  "https": "http://10.10.1.10:1080",
}
requests.get("//m.sbmmt.com", proxies=proxies)

Nach dem Login kopieren

九、关于session

我们有时候会有这样的情况，我们需要登录某个网站，然后才能请求相关url，这时就可以用到session了，我们可以先使用网站的登录api进行登录，然后得到session，最后就可以用这个session来请求其他url了：

s=requests.Session()
login_data={&#39;form_email&#39;:&#39;youremail@example.com&#39;,&#39;form_password&#39;:&#39;yourpassword&#39;}
s.post("//m.sbmmt.com/testLogin",login_data)
r = s.get(&#39;//m.sbmmt.com/notification/&#39;)
print r.text

Nach dem Login kopieren

其中，form_email和form_password是豆瓣登录框的相应元素的name值。

十、下载页面

使用Requests模块也可以下载网页，代码如下：

r=requests.get("//m.sbmmt.com")
with open("haha.html","wb") as html:
    html.write(r.content)
html.close()

Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Verwendung des Requests-Moduls von Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!