Python Pandas Schmelze Beispiel
Pandas.Melt () wird verwendet, um weite Formatdaten in ein langes Format umzuwandeln. Die Antwort besteht darin, neue Spaltennamen zu definieren, indem ID_VARS angeben, die Spalte Identifikationsspalte behalten, value_vars wählen die zu geschmolzenen Spalten, var_name und value_name aus. 1. ID_VARS = 'Name' bedeutet, dass die Spalte der Namen unverändert bleibt. anschließende Visualisierung und Analyse. Diese Operation schmilzt alle anderen Spalten standardmäßig, wenn Value_vars nicht angegeben wird, und wird häufig in Seeborn -Zeichnung und anderen Szenarien verwendet.
pandas.melt()
ist eine sehr praktische Funktion zum Konvertieren von Daten in Wideformat in Langformat, die häufig bei der Vorbereitung auf Datenreinigung und Visualisierung verwendet wird. Das Folgende ist ein einfaches Beispiel, um die Verwendung der melt
zu veranschaulichen.

Angenommen, es gibt die folgenden Weitformatdaten:
Pandas als PD importieren df = pd.dataframe ({{ 'Name': ['Alice', 'Bob', 'Charlie'], 'Math': [85, 90, 78], 'Englisch': [88, 75, 82], 'Science': [92, 85, 80] }) Druck (df)
Ausgabe:
Nennen Sie mathematische Englischwissenschaften 0 Alice 85 88 92 1 Bob 90 75 85 2 Charlie 78 82 80
In dieser Tabelle ist jeder Kurs eine Spalte und die Daten sind "breit". Wenn wir es in zwei Spalten "Artikel" und "Punktzahl" verwandeln möchten, um die anschließende Zeichnung oder Analyse zu erleichtern, können wir melt
verwenden.

Verwenden Sie melt()
, um in ein langes Format zu konvertieren
df_melted = pd.melt ( df, ID_VARS = 'Name', # Veränderte Spalten halten (Variablen identifizieren) value_vars = ['math', 'englisch', 'naturwissenschaft'], # spalte zu "schmelzen" var_name = 'Betreff', # Neue Variablenname value_name = 'Score' # Neuer Spaltenname des Wertes) print (df_melted)
Ausgabe:
Name Betreff 0 Alice Math 85 1 Bob Math 90 2 Charlie Math 78 3 Alice English 88 4 Bob English 75 5 Charlie English 82 6 Alice Science 92 7 Bob Science 85 8 Charlie Science 80
Parameterbeschreibung
-
id_vars
: Spalte, die nicht als Bezeichner geschmolzen ist (wie hierName
) -
value_vars
: Spalten, die geschmolzen werden müssen (optional, wenn nicht ausgefüllt, sind die Standardeinstellung alle Spalten außerid_vars
). -
var_name
: Der variable Name, der nach dem Schmelzen zum ursprünglichen Spaltennamen wird (Standard istvariable
) -
value_name
: Nach dem Schmelzen entspricht der Spaltenname, der dem ursprünglichen Wert entspricht (value
).
? Tipps: Wenn Sie
value_vars
nicht angeben, schmilzt Pandas automatisch alle Spalten mit Ausnahme vonid_vars
.
Zum Beispiel:
df_melted = pd.melt (df, id_vars = 'name')
Der Effekt ist der gleiche wie oben.
Praktische Anwendungsszenarien
- Bei der Erstellung von Balkendiagrammen/Zeilendiagrammen benötigen Bibliotheken wie SEABORB in der Regel eine lange Form.
- Vergleich der Gradverteilungen verschiedener Themen
- Struktur der Zeitreihendaten wurden aus mehreren Spalten in Zeitwerte verschmolzen
Verwenden Sie zum Beispiel Seeborn, um Bilder zu zeichnen:
Importieren Sie Seeborn als SNS matplotlib.pyplot als pLT importieren sns.barplot (data = df_melted, x = 'name', y = 'Score', HUE = 'Subjekt') Plt.Show ()
Grundsätzlich ist das. melt
ist nicht kompliziert, aber besonders praktisch, insbesondere wenn Sie vor einer breiten Tabelle von "eine Säule, eine Variable" ausgesetzt sind, ist die Schmelze erfrischend.
Das obige ist der detaillierte Inhalt vonPython Pandas Schmelze Beispiel. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Installieren Sie PYODBC: Verwenden Sie den Befehl pipinstallpyoDBC, um die Bibliothek zu installieren. 2. SQLServer verbinden: Verwenden Sie die Verbindungszeichenfolge, die Treiber, Server, Datenbank, UID/PWD oder Trusted_Connection über die Methode Pyodbc.Connect () und die SQL -Authentifizierung bzw. der Windows -Authentifizierung unterstützen; 3. Überprüfen Sie den installierten Treiber: Führen Sie Pyodbc.Drivers () aus und filtern Sie den Treibernamen mit 'SQLServer', um sicherzustellen, dass der richtige Treiberame wie 'ODBCDRIVER17 für SQLServer' verwendet wird. 4. Schlüsselparameter der Verbindungszeichenfolge

PythoncanbeoptimizedFormemory-BoundoperationsByreducingoverheadThroughGeneratoren, effiziente Datastrukturen und ManagingObjectLifetimes.First, UseGeneratorsinSteadofListStoprocesslargedatasetasetasematatime, Vermeidung von loloadingeNthertomemory.Secondatasetasetematatime, Choos

Shutil.rmtree () ist eine Funktion in Python, die den gesamten Verzeichnisbaum rekursiv löscht. Es kann bestimmte Ordner und alle Inhalte löschen. 1. Basisnutzung: Verwenden Sie Shutil.rmtree (Pfad), um das Verzeichnis zu löschen, und Sie müssen FilenotFoundError, Erlaubnissekror und andere Ausnahmen verarbeiten. 2. Praktische Anwendung: Sie können Ordner, die Unterverzeichnisse und Dateien enthalten, in einem Klick löschen, z. B. temporäre Daten oder zwischengespeicherte Verzeichnisse. 3. ANMERKUNGEN: Der Löschvorgang wird nicht wiederhergestellt; FilenotFoundError wird geworfen, wenn der Weg nicht existiert. Es kann aufgrund von Berechtigungen oder Einstellungen fehlschlagen. 4. Optionale Parameter: Fehler können von ignore_errors = true ignoriert werden

Verwenden Sie PSYCOPG2.POOL.SimpleconnectionPool, um Datenbankverbindungen effektiv zu verwalten und den Leistungsaufwand zu vermeiden, der durch die häufige Erstellung und Zerstörung von Verbindungen verursacht wird. 1. Geben Sie beim Erstellen eines Verbindungspools die minimale und maximale Anzahl von Verbindungen und Datenbankverbindungsparametern an, um sicherzustellen, dass der Verbindungspool erfolgreich initialisiert wird. 2. Nehmen Sie die Verbindung über getConn () ab und verwenden Sie PutConn (), um die Verbindung nach Ausführung des Datenbankvorgangs zum Pool zurückzugeben. Conn.Close () ständig aufrufen ist verboten; 3. SimpleConnectionPool ist mit Thread-sicher und für Umgebungen mit mehreren Threaden geeignet. 4.. Es wird empfohlen, einen Kontextmanager in Kombination mit Context Manager zu implementieren, um sicherzustellen, dass die Verbindung korrekt zurückgegeben werden kann, wenn Ausnahmen festgestellt werden.

Iter () wird verwendet, um das Iteratorobjekt zu erhalten, und als nächstes () wird das nächste Element erhalten. 1. Verwenden Sie Iterator (), um iterable Objekte wie Listen in Iteratoren umzuwandeln. 2. Rufen Sie als nächstes an () an, um Elemente nacheinander zu erhalten, und auslösen Sie die Ausnahme der Stopperation, wenn die Elemente erschöpft sind. 3. Verwenden Sie als nächstes (Iterator, Standard), um Ausnahmen zu vermeiden. 4. Benutzerdefinierte Iteratoren müssen die Methoden __iter __ () und __Next __ () implementieren, um die Iterationslogik zu kontrollieren; Die Verwendung von Standardwerten ist ein häufiger Weg zum sicheren Traversal, und der gesamte Mechanismus ist prägnant und praktisch.

Die Einführung in statistische Arbitrage Statistical Arbitrage ist eine Handelsmethode, die auf der Grundlage mathematischer Modelle Preisfehlanpassungen auf dem Finanzmarkt erfasst. Die Kernphilosophie beruht auf der mittleren Regression, dh, dass die Vermögenspreise kurzfristig von langfristigen Trends abweichen, aber schließlich zu ihrem historischen Durchschnitt zurückkehren. Händler verwenden statistische Methoden, um die Korrelation zwischen Vermögenswerten zu analysieren und nach Portfolios zu suchen, die normalerweise synchron verändern. Wenn das Preisverhältnis dieser Vermögenswerte ungewöhnlich abgewichen ist, ergeben sich Arbitrage -Möglichkeiten. Auf dem Kryptowährungsmarkt ist die statistische Arbitrage besonders weit verbreitet, hauptsächlich aufgrund der Ineffizienz und drastischen Marktschwankungen des Marktes selbst. Im Gegensatz zu den traditionellen Finanzmärkten arbeiten Kryptowährungen rund um die Uhr und ihre Preise sind äußerst anfällig für Verstöße gegen Nachrichten, Social -Media -Stimmung und technologische Upgrades. Diese konstante Preisschwankung schafft häufig Preisgestaltung und liefert Arbitrageure mit

Installieren Sie den entsprechenden Datenbanktreiber; 2. verwenden Sie Connect (), um eine Verbindung zur Datenbank herzustellen. 3. Erstellen Sie ein Cursorobjekt; V. 5. Verwenden Sie Fetchall () usw., um Ergebnisse zu erhalten. 6. Commit () ist nach der Änderung erforderlich; 7. Schließlich schließen Sie die Verbindung oder verwenden Sie einen Kontextmanager, um sie automatisch zu behandeln. Der vollständige Prozess stellt sicher, dass die SQL -Operationen sicher und effizient sind.

Um eine virtuelle Python -Umgebung zu erstellen, können Sie das Venv -Modul verwenden. Die Schritte sind: 1. Geben Sie das Projektverzeichnis ein, um die Python-Mvenvenv-Umgebung auszuführen, um die Umgebung zu schaffen. 2. verwenden Sie SourceEnv/bin/aktivieren Sie in Mac/Linux und Env \ Skripts \ aktivieren in Windows; 3.. Verwenden Sie das Pipinstall -Installationspaket, Pipfreeze> Anforderungen.txt, um Abhängigkeiten zu exportieren. V. Virtuelle Umgebungen können Projektabhängigkeiten isolieren, um Konflikte zu verhindern, insbesondere für die Entwicklung von Mehrfachprojekten, und Redakteure wie Pycharm oder VSCODE sind es ebenfalls
