Heim > Backend-Entwicklung > Python-Tutorial > Wie behebe ich „TypeError: In re.findall() kann kein Zeichenfolgenmuster für ein Byte-ähnliches Objekt verwendet werden' beim Extrahieren von Text aus Webseiten?

Wie behebe ich „TypeError: In re.findall() kann kein Zeichenfolgenmuster für ein Byte-ähnliches Objekt verwendet werden' beim Extrahieren von Text aus Webseiten?

Mary-Kate Olsen
Freigeben: 2024-11-25 02:41:11
Original
836 Leute haben es durchsucht

How to Resolve

TypeError: Using a String Pattern on a Bytes-Like Object in re.findall()

Beim Versuch, Text mithilfe regulärer Ausdrücke zu extrahieren In Python kann der Fehler „TypeError: In re.findall() kann kein Zeichenfolgenmuster für ein Byte-ähnliches Objekt verwendet werden“ auftreten. Dieser Fehler tritt auf, wenn Sie ein String-Regex-Muster verwenden, um ein byteähnliches Objekt zu durchsuchen, was häufig bei der Arbeit mit Webseiten auftritt.

Um dieses Problem zu beheben, ist es notwendig, das byteähnliche Objekt in ein zu dekodieren string, bevor Sie die Regex-Suche anwenden. Im bereitgestellten Code:

import urllib.request
import re

url = "http://www.google.com"
regex = r'<title>(,+?)</title>'
pattern  = re.compile(regex)

with urllib.request.urlopen(url) as response:
   html = response.read().decode('utf-8') # Decode the bytes-like object

title = re.findall(pattern, html)
print(title)
Nach dem Login kopieren

Durch die Dekodierung der HTML-Variablen mit .decode('utf-8') konvertieren wir sie in einen Unicode-String, der vom Regex-Muster verarbeitet werden kann. Dadurch kann der Code den Webseitentitel erfolgreich extrahieren.

Das obige ist der detaillierte Inhalt vonWie behebe ich „TypeError: In re.findall() kann kein Zeichenfolgenmuster für ein Byte-ähnliches Objekt verwendet werden' beim Extrahieren von Text aus Webseiten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage