


Was sind reguläre Ausdrücke in Python und wie kann das RE -Modul für das Musteranpassung verwendet werden?
Die regulären Ausdrücke von Python bieten leistungsstarke Textverarbeitungsfunktionen über das RE -Modul, mit dem Zeichenfolgen übereinstimmen, extrahieren und ersetzen können. 1. verwenden Sie Re.Search (), um festzustellen, ob in der Zeichenfolge ein bestimmtes Muster vorhanden ist. 2. Re.Match () stimmt nur vom Beginn der Zeichenfolge überein, re.Fullmatch () muss genau mit der gesamten Zeichenfolge übereinstimmen. 3.. Re.Findall () gibt eine Liste aller nicht überlappenden Übereinstimmungen zurück; 4. Spezielle Symbole wie \ d repräsentieren eine Zahl, \ w ein Wortzeichen repräsentiert, \ s ein leeres Zeichen *,,? repräsentiert eine Wiederholung von 0 oder mehrmals, 1 oder mehrmals, 0 bzw. 1 Zeit; 5. Verwenden Sie Klammern, um eine Erfassungsgruppe zu erstellen, um Informationen zu extrahieren, z. B. den Benutzernamen und den Domainnamen von E -Mails zu trennen. 6. Die Code -Lesbarkeit kann durch Benennungsgruppen verbessert werden. 7. re.sub () wird verwendet, um den passenden Inhalt zu ersetzen, und unterstützt Referenzerfassungsgruppen und kann auch die Anzahl der Ersatzstellen begrenzen. Sobald Sie reguläre Ausdrücke beherrschen, wird es zu einem Schlüsselwerkzeug zum effizienten Verarbeiten von Text.
Regelmäßige Ausdrücke in Python sind leistungsstarke Werkzeuge für die Arbeit mit Text. Sie lassen Sie Muster definieren, um Teile der Zeichenfolgen zu suchen, zu extrahieren oder zu ersetzen. Das re
Modul ist Pythons integrierter Weg, um diese Aufgaben zu erledigen.
Wenn Sie jemals in einem Textblock nach etwas Spezifisch gesucht haben - wie Telefonnummern, E -Mail -Adressen oder bestimmte Wortkombinationen -, haben Sie wahrscheinlich Regex verwendet, ohne es zu merken. In Python gibt Ihnen das re
-Modul die gleiche Leistung über Code.
Passende Muster mit re
Die grundlegendste Verwendung regulärer Ausdrücke besteht darin, zu überprüfen, ob ein Muster in einer Zeichenfolge vorhanden ist. Sie können dies mit re.search()
tun.
Zum Beispiel:
Import Re text = "Der schnelle braune Fuchs springt über den faulen Hund" match = re.Search (r'fox ', Text) Wenn Match: print ("gefunden:", match.group ())
Dies überprüft, ob das Wort "Fox" irgendwo in der Zeichenfolge erscheint. Wenn es gefunden wird, gibt es ein Match -Objekt zurück. Das r''
Präfix vor dem Muster sagt Python, dass es sich um eine rohe Schnur handelt, die verhindert, dass Fluchtzeichen falsch interpretiert werden.
Einige gemeinsame Funktionen für die grundlegende Übereinstimmung:
-
re.match()
- Überprüfte nur am Anfang der Zeichenfolge -
re.fullmatch()
- passt genau mit der gesamten Zeichenfolge ab -
re.findall()
-Findet alle nicht überlappenden Übereinstimmungen und gibt sie als Liste zurück
Gemeinsame Regex -Muster
Sie müssen keine vollständigen Sätze schreiben, um zu beschreiben, wonach Sie suchen. Stattdessen verwendet Regex eine spezielle Syntax, um Arten von Zeichen darzustellen:
-
\d
- jede Ziffer (0–9) -
\w
- Jedes Wortcharakter (Buchstaben, Ziffern und Unterstriche) -
\s
- jeder Weißespace (Raum, Registerkarte, Newline) -
.
- Jeder Charakter außer Newline -
*
,?
- Quantifizieren Sie, wie oft etwas erscheinen sollte-
*
bedeutet Null oder mehr -
?
bedeutet Null oder eins
-
Angenommen, Sie möchten Telefonnummern in einem Text wie (123) 456-7890
finden. Ein Muster könnte so aussehen:
muster = r '$ \ d {3} $ \ d {3}-\ d {4}'
Hier bedeutet \d{3}
genau drei Ziffern, und die Eltern sind mit Backslashes entkommen, weil sie in Regex eine besondere Bedeutung haben.
Informationen mit Gruppen extrahieren
Bei Regex geht es nicht nur darum, Spiele zu finden - es ist auch großartig, um bestimmte Informationen herauszuziehen. Sie können Teile eines Spiels erfassen, indem Sie sie in Eltern, genannt Gruppen , einwickeln.
Beispiel:
text = "maile mir me unter alice@example.com oder ruf 555-1234 an" match = re.Search (r '(\ w)@(\ w \. \ W)', Text), Text) Wenn Match: print ("Full Match:", match.group (0)) # alice@example.com print ("Benutzername:", Match.group (1)) # Alice print ("domain:", match.group (2)) # example.com
Dies ist besonders nützlich, wenn strukturierte Daten wie Protokolle, CSV -Zeilen oder Konfigurationsdateien analysiert werden. Jede Gruppe erfasst einen Teil des Spiels, sodass Sie separat damit arbeiten können.
Sie können auch Ihre Gruppen nennen:
match = re.Search (r '(? P <Bername> \ w)@(? print (match.group ('domain')) # Leichter zu beziehen mit Namen
Text mit re.sub
ersetzen
Eine weitere häufige Aufgabe ist das Ersetzen des übereinstimmenden Textes durch etwas anderes. Hier ist re.sub()
nützlich.
Angenommen, Sie möchten E -Mails in einem Dokument anonymisieren:
text = "Kontaktieren Sie uns unter support@example.org oder help@domain.co.uk" Cleaned = re.sub (r '\ w @(\ W \. \ W)', '[E -Mail] @\\ 1', Text) drucken (gereinigt) # Ausgabe: Kontaktieren Sie uns unter [E -Mail]@Beispiel.org oder [E -Mail]@domain.co.uk
In der Ersatzzeichenfolge bezieht sich \\1
auf die erste erfasste Gruppe - in diesem Fall die Domäne.
Sie können auch die Anzahl der Ersetzungen einschränken:
Re.Sub (Muster, Ersatz, Text, Graf = 2)
So funktioniert Regex in Python mit dem re
-Modul. Es mag sich zunächst komplex anfühlen, aber sobald Sie den Dreh raus der Syntax erhalten, wird es zu einem wesentlichen Werkzeug, um Text effizient zu behandeln.
Das obige ist der detaillierte Inhalt vonWas sind reguläre Ausdrücke in Python und wie kann das RE -Modul für das Musteranpassung verwendet werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Der Schlüssel zum Umgang mit der API -Authentifizierung besteht darin, die Authentifizierungsmethode korrekt zu verstehen und zu verwenden. 1. Apikey ist die einfachste Authentifizierungsmethode, die normalerweise in den Anforderungsheader- oder URL -Parametern platziert ist. 2. BasicAuth verwendet Benutzername und Kennwort für die Basis64 -Codierungsübertragung, die für interne Systeme geeignet ist. 3.. OAuth2 muss das Token zuerst über Client_id und Client_secret erhalten und dann das BearerToken in den Anforderungsheader bringen. V. Kurz gesagt, die Auswahl der entsprechenden Methode gemäß dem Dokument und das sichere Speichern der Schlüsselinformationen ist der Schlüssel.

In Python umfasst die Methode, Tupel mit für Schleifen zu durchqueren, direkt iteriert über Elemente, das Erhalten von Indizes und Elementen gleichzeitig und die Verarbeitung verschachtelter Tupel. 1. Verwenden Sie die für die Schleife direkt, um auf jedes Element in Sequenz zuzugreifen, ohne den Index zu verwalten. 2. Verwenden Sie Enumerate (), um den Index und den Wert gleichzeitig zu erhalten. Der Standardindex ist 0 und der Startparameter kann ebenfalls angegeben werden. 3.. Verschachtelte Tupel können in der Schleife ausgepackt werden, es ist jedoch erforderlich, um sicherzustellen, dass die Untertuple -Struktur konsistent ist, sonst wird ein Auspackfehler angehoben. Darüber hinaus ist das Tupel unveränderlich und der Inhalt kann in der Schleife nicht geändert werden. Unerwünschte Werte können durch \ _ ignoriert werden. Es wird empfohlen zu überprüfen, ob das Tupel vor dem Durchqueren leer ist, um Fehler zu vermeiden.

Python implementiert asynchrone API -Aufrufe mit asynchronen/wartet mit AIOHTTP. Verwenden Sie Async, um Coroutine -Funktionen zu definieren und sie über asyncio.run -Treiber auszuführen, z. Initiieren Sie asynchrone HTTP -Anfragen über AIOHTTP und verwenden Sie Asyncwith, um Clientsession zu erstellen und das Antwortergebnis zu erwarten. Verwenden Sie asyncio.gather, um die Aufgabenliste zu verpacken. Zu den Vorsichtsmaßnahmen gehören: Vermeidung von Blockiervorgängen, Nicht -Mischen von Synchronisationscode, und Jupyter muss speziell Ereignisschleifen verarbeiten. Master Eventl

Reine Funktionen in Python beziehen sich auf Funktionen, die immer denselben Ausgang ohne Nebenwirkungen bei der gleichen Eingabe zurückgeben. Zu den Eigenschaften gehören: 1. Determinismus, dh der gleiche Eingang erzeugt immer die gleiche Ausgabe; 2. Keine Nebenwirkungen, dh keine externen Variablen, keine Eingabedaten und keine Interaktion mit der Außenwelt. Zum Beispiel ist Defadd (A, B): Returna B eine reine Funktion, da Egal wie oft Add (2,3) aufgerufen wird, immer 5 zurückgibt, ohne andere Inhalte im Programm zu ändern. Im Gegensatz dazu sind Funktionen, die globale Variablen oder Änderungen der Eingabeparameter ändern, Nicht-Pure-Funktionen. Die Vorteile von reinen Funktionen sind: einfacher zu testen, geeigneter für die gleichzeitige Ausführung, Cache -Ergebnisse zur Verbesserung der Leistung und können mit funktionalen Programmierwerkzeugen wie MAP () und Filter () gut übereinstimmen.

Ja, ApythonCanhavemultipleConstructorToHalternativetechnik.1.UTEFAULTARGUMENTETHED__INIT__METHODTOALLIBLEINIGIALISIALISIONISCHE Withvaryingnumbersofparameter

IFELSE ist die in Python für bedingte Beurteilung verwendete Infrastruktur, und verschiedene Codeblöcke werden durch die Echtheit der Erkrankung ausgeführt. Es unterstützt die Verwendung von ELIF, um Zweige hinzuzufügen, wenn ein Multi-Konditions-Urteilsvermögen verwendet wird, und die Einführung ist der Syntaxschlüssel. Wenn Num = 15, gibt das Programm "diese Zahl größer als 10" aus; Wenn die Zuordnungslogik erforderlich ist, können ternäre Operatoren wie Status = "Erwachsener" iFage> = 18LSE "Minor" verwendet werden. 1. Ifelse wählt den Ausführungspfad gemäß den wahren oder falschen Bedingungen aus; 2. Elif kann mehrere Zustandszweige hinzufügen; 3. Die Einführung bestimmt das Eigentum des Code, Fehler führen zu Ausnahmen. 4. Der ternäre Operator ist für einfache Zuweisungsszenarien geeignet.

Obwohl es in Python kein integriertes Schlusswort gibt, kann es unübertreffliche Methoden durch das Umschreiben von Namen, Laufzeitausnahmen, Dekoratoren usw. simulieren. 1. 1. Verwenden Sie das Präfix doppelt unterstrichen, um das Umschreiben des Namens auszulösen, was es für Unterklassen schwierig macht, Methoden zu überschreiben. 2. Beurteilen Sie den Anrufertyp in der Methode und geben Sie eine Ausnahme, um die Neudefinition der Unterklasse zu verhindern. 3. Verwenden Sie einen benutzerdefinierten Dekorator, um die Methode als endgültig zu markieren und in Kombination mit Metaklas oder Klassendekorateur zu überprüfen. 4. Das Verhalten kann als Eigenschaftsattribute eingekapselt werden, um die Möglichkeit einer geänderten Änderung zu verringern. Diese Methoden bieten unterschiedliche Schutzgrade, aber keiner von ihnen schränkt das Deckungsverhalten vollständig ein.

In Python ist die Verwendung von A for Loop mit der Funktion von range () eine häufige Möglichkeit, die Anzahl der Schleifen zu steuern. 1. Verwenden Sie, wenn Sie die Anzahl der Schleifen kennen oder nach Index zugreifen müssen. 2. Bereich (Stopp) von 0 bis Stopp-1, Bereich (Start, Stopp) von Start bis Stopp-1, Bereich (Start, Stopp) fügt die Schrittgröße hinzu; 3.. Beachten Sie, dass der Bereich nicht den Endwert enthält und iterable Objekte anstelle von Listen in Python 3 zurückgibt. 4.. Sie können überlist (range ()) in eine Liste konvertieren und negative Schrittgröße in umgekehrter Reihenfolge verwenden.
