Untuk sains data, Python biasanya digunakan secara meluas untuk pemprosesan dan transformasi data Ia menyediakan fungsi pemprosesan struktur data yang berkuasa untuk menjadikan pemprosesan data lebih fleksibel Apakah maksud "fleksibiliti" di sini?
Ini bermakna ada sentiasa berbilang cara untuk mencapai hasil yang sama dalam Python, kami sentiasa mempunyai kaedah yang berbeza dan perlu memilih kaedah yang mudah digunakan, menjimatkan masa dan memberikan kawalan yang lebih baik.
Adalah mustahil untuk menguasai semua kaedah ini. Jadi, berikut ialah senarai 4 petua Python yang perlu anda ketahui apabila bekerja dengan sebarang jenis data.
Pemahaman senarai ialah cara yang elegan dan paling mesra ular sawa untuk membuat senarai. Berbanding dengan pernyataan untuk gelung dan if, pemahaman senarai mempunyai sintaks yang lebih pendek untuk mencipta senarai baharu berdasarkan nilai senarai sedia ada. Jadi mari kita lihat bagaimana ciri ini mendapat salinan senarai.
Kadangkala anda perlu membuat salinan senarai sedia ada. Jawapan paling mudah ialah .copy(), yang membolehkan anda menyalin kandungan satu senarai ke senarai (baru) yang lain.
Sebagai contoh, senarai integer original_list.
original_list = [10,11,20,22,30,34]
Senarai ini boleh disalin hanya menggunakan kaedah .copy().
duplicated_list = original_list.copy()
Kefahaman senarai memberikan output yang sama. Menyalin senarai ialah contoh yang bagus untuk memahami pemahaman senarai.
Lihat kod di bawah.
duplicated_list = [item for item in original_list]
Ini bukan untuk mengatakan bahawa adalah lebih baik untuk menggunakan pemahaman senarai semasa menyalin senarai, tetapi ia adalah untuk mengatakan bahawa kes ini adalah yang terbaik untuk memperkenalkan kaedah kerja pemahaman senarai.
Seterusnya, mari kita lihat cara pemahaman senarai menjadikan kehidupan mudah apabila melakukan operasi matematik pada setiap elemen senarai.
Cara darab yang paling mudah atau langsung ialah menggunakan operator darab, iaitu *
Contohnya, ingin menggunakan skalar ( iaitu nombor 5) Darab setiap item dalam senarai. Anda pasti tidak boleh menggunakan original_list*5 di sini kerana ia akan mencipta 5 salinan senarai.
Dalam senario ini, jawapan terbaik ialah pemahaman senarai, seperti yang ditunjukkan di bawah.
original_list = [10,11,20,22,30,34] multiplied_list = [item*5 for item in original_list] # Output [50, 55, 100, 110, 150, 170]
Operasi di sini tidak terhad kepada mendarab nombor. Operasi kompleks boleh dilakukan pada setiap elemen senarai asal.
Sebagai contoh, andaikan anda ingin mengira kubus punca kuasa dua bagi setiap sebutan Anda boleh menyelesaikannya dalam satu baris.
multiplied_list = [math.sqrt(item)**3 for item in original_list] # Output [31.6227766016838, 36.4828726939094, 89.4427190999916, 103.18914671611546, 164.31676725154983, 198.25236442474025]
Fungsi sqrt yang digunakan untuk mengira punca kuasa dua nombor adalah kepunyaan matematik perpustakaan, jadi dalam kes ini anda perlu mengimportnya sebelum menggunakannya.
Serupa dengan fungsi terbina dalam yang ditunjukkan di atas, ia juga mungkin untuk menggunakan fungsi yang ditentukan pengguna pada setiap elemen senarai.
Sebagai contoh, fungsi mudah seperti yang ditunjukkan di bawah.
def simple_function(item): item1 = item*10 item2 = item*11 return math.sqrt(item1**2 + item2**2)
Anda boleh menggunakan fungsi yang ditentukan pengguna ini pada setiap item dalam senarai.
multiplied_list = [simple_function(item) for item in original_list] # Output [148.66068747318505, 163.52675622050356, 297.3213749463701, 327.0535124410071, 445.9820624195552, 505.4463374088292]
Pemahaman senarai lebih berguna dalam senario kehidupan sebenar. Biasanya dalam tugasan analisis, anda perlu memadamkan jenis elemen tertentu daripada senarai, seperti menghapuskan elemen nan. Pemahaman senarai ialah alat yang sesuai untuk tugasan ini.
Menapis data berdasarkan kriteria tertentu ialah salah satu tugas biasa untuk memilih set data yang diingini, dan logik yang sama digunakan dalam pemahaman senarai.
Andaikan anda mempunyai senarai nombor yang dinyatakan di bawah.
original_list = [10, 22, -43, 0, 34, -11, -12, -0.1, 1]
Anda mahu menyimpan hanya nilai positif daripada senarai ini. Jadi secara logiknya anda mahu menyimpan hanya item yang bernilai TRUE untuk item bersyarat > 0.
new_list = [item for item in original_list if item > 0] # Output [10, 22, 34, 1]
jika klausa digunakan untuk memadamkan nilai negatif. Anda boleh menggunakan sebarang syarat menggunakan klausa if untuk mengalih keluar sebarang item daripada senarai.
Contohnya, apabila anda ingin mengalih keluar semua sebutan yang kuasa duanya kurang daripada 200, anda hanya perlu menyebut istilah bersyarat **2 > 200 dalam sintesis senarai, seperti yang ditunjukkan di bawah.
new_list = [item for item in original_list if item**2 > 200] # Output [22, -43, 34]
Apabila berurusan dengan set data sebenar, syarat untuk menapis item senarai mungkin jauh lebih kompleks, kaedah ini pantas dan mudah difahami.
Kadangkala perlu mencipta kamus daripada nilai dalam dua senarai. Daripada menaipnya satu demi satu, anda boleh menggunakan pemahaman kamus (kamus pemahaman), yang merupakan cara yang elegan dan ringkas untuk mencipta kamus!
Ia berfungsi sama seperti pemahaman senarai, satu-satunya perbezaan ialah - apabila membuat pemahaman senarai, anda melampirkan segala-galanya dalam kurungan segi empat sama, seperti [], manakala dalam pemahaman kamus, anda menyertakan semua yang disertakan dalam pendakap kerinting, seperti {}.
Andaikan terdapat dua senarai - medan dan butiran - seperti yang ditunjukkan di bawah.
fields = [‘name’, ‘country’, ‘age’, ‘gender’] details = [‘pablo’, ‘Mexico’, 30, ‘Male’]
Cara mudah adalah dengan menggunakan pemahaman kamus seperti ini -
new_dict = {key: value for key, value in zip(fields, details)} # Output {'name': 'pablo', 'country': 'Mexico', 'age': 30, 'gender': 'Male'}
Perkara penting untuk difahami di sini ialah bagaimana fungsi zip berfungsi.
Dalam Python, fungsi zip menerima objek boleh lelar seperti rentetan, senarai atau kamus sebagai input dan mengembalikannya digabungkan menjadi tupel.
Jadi dalam kes ini zip telah membentuk sepasang setiap item daripada medan senarai dan butiran. Apabila menggunakan key:value dalam pemahaman kamus, cuma bongkar tuple ini ke dalam pasangan nilai kunci individu.
Apabila menggunakan pembina dict() terbina dalam Python (untuk mencipta kamus), proses itu menjadi lebih pantas, kerana dict() sekurang-kurangnya 1.3 kali lebih pantas daripada pemahaman kamus!
Jadi kita perlu menggunakan pembina ini dengan fungsi zip(), sintaksnya lebih mudah - dict(zip(medan, butiran))
Seperti yang saya nyatakan di bermula, Python sangat fleksibel kerana terdapat pelbagai cara untuk mencapai hasil yang sama. Bergantung pada kerumitan tugas, anda perlu memilih cara terbaik untuk mencapainya.
Saya harap artikel ini berguna kepada anda. Jika ada cara lain untuk melakukan perkara yang sama yang saya nyatakan dalam artikel ini, sila beritahu saya.
Atas ialah kandungan terperinci Empat teknik pembangunan deduktif Python untuk menjadikan kod anda lebih cekap. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!