Der Inhalt dieses Artikels befasst sich mit der Berechnung einfacher Statistiken in Python. Ich hoffe, dass er für Freunde hilfreich ist.
1. Stellen Sie für diese Vorgänge sicher, dass die integrierte Anaconda-Bibliothek auf dem Computer installiert ist. Wenn nach der Installation ein Fehler auftritt, können Sie Python auf dem ursprünglichen Computer deinstallieren und neu installieren Empfohlen während der Installation. Aktivieren Sie direkt die Option Umgebungsvariablen hinzufügen, andernfalls müssen Sie in Zukunft selbst Umgebungsvariablen hinzufügen. Wählen Sie im Compiler in Pycharm Python im Anaconda-Installationsordner aus. Erstellen Sie in Pycharm einen neuen Datenordner, um Datendateien zu speichern.
2. Öffnen Sie die Python-Konsole.
3. Verwenden Sie zuerst Python, um die Daten zu lesen. Sie müssen zuerst import pandas as pd eingeben, um das Pandas-Paket einzuführen, und dann df=pd.read_csv("./data/CityData.csv") eingeben Lesen Sie die Daten und geben Sie schließlich df ein, um die Daten anzuzeigen.
4. Geben Sie type(df) bzw. type(df["cid"]) ein, um festzustellen, dass die beiden Datentypen unterschiedlich sind. 5. Berechnen Sie den Durchschnitt : df.mean() oder df["xid"].mean()
6. Berechnen Sie den Median: Geben Sie df.median( ) ein. oder df["yid"].median
7. Quartile finden: Geben Sie df .quantile(q ein =0,25)
8. Finden Sie den Modus: Geben Sie df.mode() oder df["xid"].mode( )
ein
10. Varianz berechnen: df.var() oder df["xid"].var()
11 df["xid"].sum()
12. Berechnen Sie den Skew-Koeffizienten: df.skew() oder df[ "yid"] .skew()
13. Berechnen Sie den Kurtosis-Koeffizienten: df.kurt() oder df["yid"].kurt ()
14. Pandas kann sie nicht direkt generieren. Sie müssen zuerst sss eingeben und dann ss eingeben Was zu diesem Zeitpunkt generiert wird, ist ein normalverteiltes Objekt. Zur Überprüfung geben wir ss.norm.stats(moments="mvsk") ein.
Zu diesem Zeitpunkt können wir sehen, dass vier Werte generiert werden, die dem mvsk der Normalverteilung entsprechen, nämlich 0, 1, 0 bzw. 0. 15.ss.norm.pdf(0.0) stellt den Wert der Ordinate dar, wenn die Abszisse 0 ist. ss.norm.ppf(0.9) bedeutet, dass der Wert, der bei der Akkumulation von negativ unendlich bis zum Rückgabewert erhalten wird, 0,9 beträgt, wobei der Wert nach ppf zwischen 0 und 1 liegen muss. ss.norm.cdf(2) stellt den Rückgabewert bei der Integration von negativ Unendlich bis 2 dar, und ss.norm.rvs(size=10) kann 10 Zufallszahlen erhalten, die der Normalverteilung entsprechen.
16. Ebenso können wir ss.chi2 und ss.t eingeben, um die Chi-Quadrat-Verteilung bzw. die T-Verteilung zu erhalten.
17 Darüber hinaus können wir auch Stichproben durchführen. Geben Sie df.sample(n=10) ein, um 10 Stichproben aus den Daten zu extrahieren df. sample(frac=0,1) nimmt eine 10 %ige Stichprobe aus den Daten.
Das obige ist der detaillierte Inhalt vonBerechnung einfacher Statistiken in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!