Heim > Backend-Entwicklung > Python-Tutorial > So verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x

So verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x

王林
Freigeben: 2023-08-02 12:39:18
Original
955 Leute haben es durchsucht

So verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x

Übersicht:
Im Prozess der Datenanalyse und Datenverarbeitung ist Pandas eine sehr leistungsstarke und häufig verwendete Python-Bibliothek. Es bietet Datenstrukturen und Datenanalysetools für eine schnelle und effiziente Datenverarbeitung und -analyse. In diesem Artikel wird die Verwendung von Pandas für die Datenanalyse in Python 2.x vorgestellt und den Lesern einige Codebeispiele zur Verfügung gestellt.

Pandas installieren:
Bevor Sie beginnen, müssen Sie zunächst die Pandas-Bibliothek installieren. Sie können zur Installation den folgenden Befehl über das Terminal oder die Eingabeaufforderung eingeben:

pip install pandas
Nach dem Login kopieren

Datenstruktur:
pandas bietet zwei Hauptdatenstrukturen: 1) Serie 2) DataFrame.

Series ist eine indizierte eindimensionale Array-Struktur, ähnlich einer Spalte in Excel. Codebeispiel:

import pandas as pd

# 创建一个Series对象
data = pd.Series([1, 3, 5, np.nan, 6, 8])

print(data)
Nach dem Login kopieren

Ausgabeergebnis:

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64
Nach dem Login kopieren

DataFrame ist eine zweidimensionale Tabellenstruktur, ähnlich einer Tabelle in Excel. Codebeispiel:

import pandas as pd
import numpy as np

# 创建一个DataFrame对象
data = pd.DataFrame({
    "A": [1, 2, 3, 4],
    "B": pd.Timestamp('20130102'),
    "C": pd.Series(1, index=list(range(4)), dtype='float32'),
    "D": np.array([3] * 4, dtype='int32'),
    "E": pd.Categorical(["test", "train", "test", "train"]),
    "F": 'foo'
})

print(data)
Nach dem Login kopieren

Ausgabeergebnisse:

   A          B    C  D      E    F
0  1 2013-01-02  1.0  3   test  foo
1  2 2013-01-02  1.0  3  train  foo
2  3 2013-01-02  1.0  3   test  foo
3  4 2013-01-02  1.0  3  train  foo
Nach dem Login kopieren

Lesen und Schreiben von Daten:
Pandas können mehrere Datenformate lesen und schreiben, einschließlich CSV-Dateien, Excel-Dateien, SQL-Datenbanken usw.

Beispiel zum Lesen einer CSV-Datei:

import pandas as pd

# 从CSV文件中读取数据
data = pd.read_csv('data.csv')

print(data.head())
Nach dem Login kopieren

Beispiel zum Lesen einer Excel-Datei:

import pandas as pd

# 从Excel文件中读取数据
data = pd.read_excel('data.xlsx')

print(data.head())
Nach dem Login kopieren

Datenanalyse und -verarbeitung:
pandas bietet viele leistungsstarke Funktionen und Methoden für die Datenanalyse und -verarbeitung.

Beispiel für statistische Datenanalyse:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 统计描述性统计信息
print(data.describe())

# 计算各列之间的相关系数
print(data.corr())
Nach dem Login kopieren

Beispiel für Datenfilterung und -sortierung:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 筛选出满足条件的数据
filtered_data = data[data['age'] > 30]

# 按照某列进行排序
sorted_data = data.sort_values('age')

print(filtered_data.head())
print(sorted_data.head())
Nach dem Login kopieren

Beispiel für Datengruppierung und -aggregation:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 按照某一列进行分组
grouped_data = data.groupby('gender')

# 计算每组的平均值
mean_data = grouped_data.mean()

print(mean_data)
Nach dem Login kopieren

Beispiel für das Schreiben von Daten in eine CSV- oder Excel-Datei:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 将数据写入到CSV文件中
data.to_csv('output.csv', index=False)

# 将数据写入到Excel文件中
data.to_excel('output.xlsx', index=False)
Nach dem Login kopieren

Zusammenfassung:
pandas ist Python 2.x A häufig verwendete Datenanalysebibliothek. In diesem Artikel werden die Installationsmethode von Pandas und gängige Datenstrukturen, Methoden zum Lesen und Schreiben von Daten sowie gängige Methoden zur Datenanalyse und -verarbeitung vorgestellt. Leser können Pandas flexibel für die Datenanalyse und -verarbeitung entsprechend ihren eigenen Bedürfnissen verwenden.

Das Obige ist die Einführung dieses Artikels zur Verwendung des Pandas-Moduls für die Datenanalyse in Python 2.x. Ich hoffe, es wird Ihnen hilfreich sein!

Das obige ist der detaillierte Inhalt vonSo verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage