Wie kann ich Zeichenfolgen mithilfe mehrerer Wortgrenzentrennzeichen in Python in Wörter aufteilen?-Python-Tutorial-php.cn

Wie kann ich Zeichenfolgen mithilfe mehrerer Wortgrenzentrennzeichen in Python in Wörter aufteilen?

Barbara Streisand

Freigeben： 2024-12-17 00:20:26

Original

341 Leute haben es durchsucht

How Can I Split Strings into Words Using Multiple Word Boundary Delimiters in Python?

Aufteilen von Zeichenfolgen in Wörter mit mehreren Trennzeichen für Wortgrenzen

Beim Umgang mit Textdaten besteht eine häufige Aufgabe darin, Zeichenfolgen in einzelne Wörter aufzuteilen. Die Methode str.split() von Python bietet eine einfache Lösung, unterstützt jedoch nur ein einzelnes Trennzeichen als Argument. Diese Einschränkung kann beim Umgang mit Text, der mehrere Arten von Wortgrenzen enthält, wie z. B. Satzzeichen, zu einem Hindernis werden.

Das Python-Re-Modul bietet eine leistungsstarke Alternative: re.split(). Mit dieser Funktion können Sie ein Muster angeben, das als Wortgrenzentrennzeichen verwendet werden soll. Das Muster kann reguläre Ausdrücke enthalten, um mehrere Arten von Grenzen gleichzeitig abzugleichen.

Um beispielsweise die folgende Zeichenfolge in Wörter aufzuteilen und dabei sowohl Leerzeichen als auch Satzzeichen als Wortgrenzen zu behandeln:

"Hey, you - what are you doing here!?"

Nach dem Login kopieren

Sie können das folgende Muster für reguläre Ausdrücke verwenden:

'\W+'

Nach dem Login kopieren

Dieses Muster entspricht jeder Folge von Nicht-Wort-Zeichen (alphabetisch, numerisch oder Unterstrich). Bei Verwendung mit re.split() wird die Zeichenfolge bei allen Vorkommen dieser Zeichen geteilt, wodurch effektiv eine Liste von Wörtern erstellt wird.

So können Sie es in Python verwenden:

import re

text = "Hey, you - what are you doing here!?"
words = re.split('\W+', text)

print(words)

Nach dem Login kopieren

Ausgabe:

['Hey', 'you', 'what', 'are', 'you', 'doing', 'here']

Nach dem Login kopieren

Wie Sie sehen können, teilt re.split() die Zeichenfolge effektiv in einzelne Wörter auf und behält dabei trotz der Anwesenheit die korrekten Wortgrenzen bei aus mehreren Trennzeichen. Diese Flexibilität macht es zu einem wertvollen Werkzeug für die Handhabung komplexer Textanalyseszenarien, bei denen mehrere Wortgrenzentrennzeichen auftreten.

Das obige ist der detaillierte Inhalt vonWie kann ich Zeichenfolgen mithilfe mehrerer Wortgrenzentrennzeichen in Python in Wörter aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!