Jenis fail HDF5 (Format Data Hierarki 5) sering digunakan untuk menyimpan dan memproses set data yang besar dan kompleks. Ia sesuai untuk kegunaan saintifik dan perindustrian kerana ia serba boleh, berskala dan berkesan. Python ialah salah satu daripada banyak bahasa pengaturcaraan yang boleh digunakan untuk menjana, membaca, dan mengubah suai fail HDF5. Dalam tutorial ini, kami akan menunjukkan kepada anda cara bekerja dengan fail HDF5 dalam Python.
Kita perlu memasang pakej "h5py". Kami boleh memasangnya menggunakan pip pemasang pakej Python.
pip install h5py
Untuk mencipta fail HDF5 dalam Python, kita perlu mencipta contoh kelas "h5py.File". Kami kemudiannya boleh menggunakan contoh ini untuk mencipta dan memanipulasi set data dan kumpulan dalam fail.
import h5py file = h5py.File("filename.hdf5", "w")
Import h5pymodul
Objek h5py hendaklah dibuat menggunakan pengepala dan mod daripada jenis fail ("w" untuk menulis, "r" untuk membaca)
Gunakan fungsi "Buat Set Data" dan "Buat Kumpulan" untuk mencipta set data dan kumpulan dalam fail.
Isi set data menggunakan tatatanda tatasusunan NumPy biasa.
Gunakan teknik "tutup" untuk mengosongkan memori objek dan siram data ke fail.
Buat fail HDF5 menggunakan set data tunggal
import h5py # Create a new HDF5 file file = h5py.File("example.hdf5", "w") # Create a dataset dataset = file.create_dataset("data", shape=(10,), dtype='i') # Write data to the dataset for i in range(10): dataset[i] = i # Close the file file.close()
Import dahulu pakej h5py yang dipasang. Buat fail HDF5 baharu bernama "example.hdf5" dengan kebenaran menulis. Kemudian, buat koleksi yang dipanggil "data", yang mempunyai bentuk (10,) dan jenis data ialah integer. Kami kemudian menggunakan gelung untuk meletakkan nombor dalam julat 0 hingga 9 ke dalam set data. Untuk mengelakkan kebocoran memori dan menjamin bahawa semua data telah dimasukkan ke dalam fail, kami mengalih keluarnya pada penghujungnya. Kod ini menunjukkan cara menggunakan modul Python h5py untuk mencipta fail HDF5 baharu, set data dan menambah data padanya.
Baca data daripada fail HDF5 sedia ada
import h5py import numpy as np # Open an existing HDF5 file file = h5py.File("example.hdf5", "r") # Read the dataset into a NumPy array dataset = file["data"] data = np.array(dataset) # Close the file file.close() # Print the data print(data)
[0 1 2 3 4 5 6 7 8 9]
Ini akan membaca fail example.hdf5 yang dibuat dalam contoh sebelumnya, menyahsulitnya dan mencetaknya ke konsol.
Format fail yang berkuasa untuk menyimpan dan mengedarkan set data yang besar dipanggil HDF5. Ia menyediakan rangka kerja berlapis untuk organisasi data dan menyokong pemotongan dan pemampatan untuk storan yang cekap. Modul h5py menyediakan API yang mudah difahami untuk menjana, membaca dan menulis fail HDF5, membolehkan HDF5 diserap dengan mudah ke dalam aplikasi Python. HDF5 ialah alat yang berguna untuk sesiapa sahaja yang bekerja dengan fail besar dalam Python kerana banyak kegunaannya.
Atas ialah kandungan terperinci Fail HDF5 dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!