Membuat Bingkai Data Pandas dengan Baris Berjujukan
Dalam tugas analisis data, selalunya perlu untuk mencipta Pandas DataFrame dan menambah secara berulang baris kepadanya. Untuk mencapai matlamat ini, beberapa kaedah tersedia, masing-masing mempunyai kelebihan tersendiri.
Satu pendekatan ialah menggunakan pembina pd.DataFrame() dengan parameter lajur untuk menentukan nama lajur yang dikehendaki. DataFrame kosong dibuat, kemudian baris boleh ditambah satu demi satu menggunakan kaedah _set_value() untuk menetapkan nilai medan individu. Walau bagaimanapun, kaedah ini tidak cekap jika berbilang medan perlu ditambah secara serentak untuk setiap baris.
Penyelesaian yang lebih cekap ialah menggunakan sintaks df.loc[i], dengan i mewakili indeks baris. Dengan memberikan senarai nilai kepada df.loc[i], keseluruhan baris pada indeks i boleh diisi dalam satu langkah. Pendekatan ini jauh lebih pantas untuk set data yang besar, kerana ia mengelakkan keperluan untuk berbilang panggilan _set_value().
Untuk menunjukkan kaedah ini, pertimbangkan coretan kod berikut:
import numpy as np import pandas as pd df = pd.DataFrame(columns=['lib', 'qty1', 'qty2']) for i in range(5): df.loc[i] = ['name' + str(i)] + list(np.random.randint(10, size=2)) print(df)
Kod ini mencipta DataFrame kosong dengan tiga lajur: 'lib', 'qty1' dan 'qty2'. Ia kemudian menjana lima baris data, dengan 'nama' diikuti dengan dua nilai integer yang dijana secara rawak dalam lajur yang tinggal. Hasilnya ialah DataFrame dengan struktur dan data yang ditentukan:
lib qty1 qty2 0 name0 3 3 1 name1 2 4 2 name2 2 8 3 name3 2 1 4 name4 9 6
Atas ialah kandungan terperinci Bagaimana untuk Mencipta Pandas DataFrame dengan Cekap dengan Baris Berjujukan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!