kaedah analisis data panda dalam amalan: daripada pemuatan data hingga kejuruteraan ciri, contoh kod khusus diperlukan
Pengenalan:
Pandas ialah perpustakaan analisis data yang digunakan secara meluas dalam Python, menyediakan pelbagai alatan pemprosesan dan analisis data. Artikel ini akan memperkenalkan kaedah khusus daripada pemuatan data kepada kejuruteraan ciri dan memberikan contoh kod yang berkaitan.
1. Pemuatan data
Pemuatan data ialah langkah pertama analisis data. Dalam Pandas, anda boleh menggunakan pelbagai kaedah untuk memuatkan data, termasuk membaca fail tempatan, membaca data rangkaian, membaca pangkalan data, dsb.
import pandas as pd data = pd.read_csv("data.csv")
import pandas as pd url = "https://www.example.com/data.csv" data = pd.read_csv(url)
import pandas as pd from sqlalchemy import create_engine engine = create_engine('sqlite:///database.db') data = pd.read_sql("SELECT * FROM table", engine)
2 Pratonton dan pemprosesan data
Selepas memuatkan data, anda boleh menggunakan kaedah yang disediakan oleh Pandas untuk pratonton dan proses awal data.
data.head() # 预览前5行 data.tail(10) # 预览后10行
data.isnull() # 判断缺失值 data.fillna(0) # 填充缺失值为0
data.duplicated() # 判断重复值 data.drop_duplicates() # 去除重复值
data[data['column'] > 100] = 100 # 将大于100的值设为100
3. Kejuruteraan Ciri
Kejuruteraan ciri ialah langkah utama dalam analisis data Dengan mengubah data mentah kepada ciri yang lebih sesuai untuk pemodelan, prestasi model boleh dipertingkatkan. Pandas menyediakan pelbagai kaedah untuk kejuruteraan ciri.
selected_features = data[['feature1', 'feature2']]
encoded_data = pd.get_dummies(data)
from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data)
data['new_feature'] = data['feature1'] + data['feature2']
Kesimpulan:
Artikel ini memperkenalkan kaedah daripada pemuatan data kepada kejuruteraan ciri dalam analisis data Pandas dan menunjukkan operasi berkaitan melalui contoh kod tertentu. Dengan pemprosesan data dan fungsi analisis Pandas yang berkuasa, kami boleh menjalankan analisis data dan perlombongan dengan lebih cekap. Dalam aplikasi praktikal, operasi dan kaedah yang berbeza boleh dipilih mengikut keperluan khusus untuk meningkatkan ketepatan dan kesan analisis data.
Atas ialah kandungan terperinci Kaedah analisis data panda berorientasikan contoh: pertempuran praktikal pemuatan data dan kejuruteraan ciri. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!