Bibliothek für reguläre Ausdrücke in Python für den Mustervergleich und die Bearbeitung von Textdaten. Wir können reguläre Ausdrücke verwenden, um den ersten Buchstaben jedes Wortes auszugeben, indem wir die Mustervergleichsfunktion verwenden, um neue Wörter nach Leerzeichen zu identifizieren. In diesem Artikel implementieren wir ein Programm, das mithilfe regulärer Ausdrücke den ersten Buchstaben jedes Wortes ausgibt.
Reguläre Ausdrücke oder reguläre Ausdrücke sind Werkzeuge zum Mustervergleich im Text. Dabei handelt es sich um Zeichenfolgen, die ein Suchmuster definieren. Sie werden häufig in der Programmierung, insbesondere in der Textverarbeitung, verwendet und von den meisten Programmiersprachen, einschließlich Python, unterstützt.
Drucken Sie den ersten Buchstaben jedes Wortes mit regulären Ausdrücken
Um den ersten Buchstaben jedes Wortes mit einem regulären Ausdruck auszugeben, müssen wir zuerst das re-Modul importieren und eine Funktion namens first_letter erstellen, die eine Zeichenfolge als Parameter akzeptiert. In der Funktion first_letter verwenden wir die Methode re.findall(), um alle Wörter in der Zeichenfolge zu finden. Das reguläre Ausdrucksmuster 'bw' wird verwendet, um das erste Zeichen jedes Wortes zu finden. „b“ ist eine Wortgrenze, die der Position zwischen einem Wortzeichen und einem Nichtwortzeichen entspricht. „w“ entspricht jedem Wortzeichen (Buchstabe, Zahl oder Unterstrich).
Die Methodere.findall() gibt eine Liste aller Zeichen eines Worts in einer Zeichenfolge zurück. Dann fügen wir die Liste der Zeichen mit der Methode join() zusammen.
re.findall(pattern, string, flags=0)
Hier gibt die Methode „findall()“ alle nicht überlappenden Übereinstimmungen des regulären Ausdrucksmusters in der Zeichenfolge zurück. Diese Methode benötigt drei Parameter: das reguläre Ausdrucksmuster, die zu suchende Zeichenfolge und optionale Flags. Es wird eine Liste aller Übereinstimmungen zurückgegeben.
string.join(iterable)
Hier fügt die Methode „join()“ iterierbare Elemente (z. B. Liste, Tupel, String) zu einem einzigen String zusammen, wobei der angegebene String als Trennzeichen zwischen den einzelnen Elementen verwendet wird. Diese Methode benötigt einen einzelnen Parameter: das iterierbare Objekt, das verkettet werden soll.
re.finditer(pattern, string, flags=0)
Hier gibt die Methode „finditer()“ einen Iterator von Übereinstimmungsobjekten für alle nicht überlappenden Übereinstimmungen des regulären Ausdrucksmusters in der Zeichenfolge zurück. Diese Methode benötigt drei Parameter: das reguläre Ausdrucksmuster, die zu suchende Zeichenfolge und optionale Flags. Es gibt einen Iterator von Übereinstimmungsobjekten zurück, der zum Extrahieren übereinstimmender Zeichenfolgen verwendet werden kann.
re.split(pattern, string, maxsplit=0, flags=0)
Hier teilt die Methode „split()“ die Zeichenfolge in eine Liste von Teilzeichenfolgen auf, wobei ein reguläres Ausdrucksmuster als Trennzeichen verwendet wird. Diese Methode benötigt vier Parameter: das reguläre Ausdrucksmuster, die zu teilende Zeichenfolge, die maximale Anzahl von Teilungen (Standard ist 0, was alle möglichen Teilungen angibt) und optionale Flags. Es gibt eine Liste von Teilzeichenfolgen zurück.
Im folgenden Beispiel erstellen wir eine Zeichenfolge „Python ist eine beliebte Programmiersprache“ und übergeben sie an die Funktion „first_letter“. Die Funktion gibt dann den ersten Buchstaben jedes Wortes zurück und wir können dann die zurückgegebenen Zeichen mit der Methode „join()“ verbinden und die Ausgabe drucken.
import re def first_letter(string): words = re.findall(r'\b\w', string) return "".join(words) string = "Python is a popular programming language" result = first_letter(string) print(result)
Piappl
Im folgenden Beispiel verwenden wir zunächst die Methode „re.split()“, um die Zeichenfolge in eine Liste von Wörtern aufzuteilen, wobei wir „W+“ als Trennzeichen verwenden. „W“ stimmt mit jedem Nicht-Wort-Zeichen überein, „+“ gibt ein oder mehrere Vorkommen an. Wir fügen außerdem einen Filter hinzu, um alle leeren Zeichenfolgen aus der Liste zu entfernen. Als nächstes verwenden wir ein Listenverständnis, um das erste Zeichen jedes Wortes zu extrahieren und es als Liste zurückzugeben. Abschließend fügen wir die Liste der Zeichen mit der Methode „str.join()“ wieder zu einem String zusammen.
import re def first_letter(string): return ''.join([word[0] for word in re.split('\W+', string) if word]) string = "Python is a popular programming language" result = first_letter(string) print(result)
Piappl
Im folgenden Beispiel verwenden wir die Methode „re.finditer()“, um alle Vorkommen des regulären Ausdrucksmusters „bw“ in einem String zu finden. Anschließend durchlaufen wir jede Übereinstimmung und hängen das erste Zeichen an die resultierende Zeichenfolge an.
import re def first_letter(string): result = "" for match in re.finditer(r'\b\w', string): result += match.group() return result string = "Python is a popular programming language" result = first_letter(string) print(result)
Piappl
Im folgenden Beispiel verwenden wir die Methode „re.split()“, um die Zeichenfolge in eine Liste von Wörtern und Trennzeichen aufzuteilen. Das reguläre Ausdrucksmuster „(W+)“ entspricht einem oder mehreren Vorkommen eines beliebigen Nicht-Wort-Zeichens „W“. Klammern erfassen Trennzeichen in separaten Elementen in der Liste. Anschließend verwenden wir ein Listenverständnis, um das erste Zeichen jedes Wortes zu extrahieren und es als Liste zurückzugeben. Abschließend fügen wir die Liste der Zeichen mit der Methode „str.join()“ wieder zu einem String zusammen.
import re def first_letter(string): return ''.join([word[0] for word in re.split(r'(\W+)', string) if word]) string = "Python is a popular programming language" result = first_letter(string) print(result)
P i a p p l
In diesem Artikel haben wir besprochen, wie man den ersten Buchstaben jedes Wortes mit regulären Ausdrücken druckt. Reguläre Ausdrücke sind leistungsstarke Werkzeuge für den Mustervergleich in Textdaten. Um den ersten Buchstaben jedes Wortes auszugeben, verwenden wir die Methode re.findall() , um das erste Zeichen des Wortes in der Zeichenfolge zu finden und verbinden dann jedes Zeichen mit der Funktion join().
Das obige ist der detaillierte Inhalt vonPython-Programm zum Drucken des ersten Buchstabens jedes Wortes mithilfe regulärer Ausdrücke. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!