Mengalih keluar Pendua Berturut-turut dalam Panda
Walaupun kaedah drop_duplicates() Pandas berkesan untuk menghapuskan semua nilai pendua, ia tidak membezakan kejadian berturut-turut . Untuk menangani had ini, terdapat kaedah yang cekap untuk secara selektif menggugurkan pendua berturut-turut sahaja.
Satu pendekatan menggunakan fungsi anjakan untuk membandingkan nilai semasa dengan yang sebelumnya:
a.loc[a.shift() != a]
Logik ini kembali topeng di mana pendua berturut-turut dicirikan oleh nilai Palsu. Kaedah loc kemudian memilih hanya baris dengan nilai True, dengan berkesan mengalih keluar pendua berturut-turut.
Kaedah lain menggunakan fungsi diff untuk mengesan perubahan:
a.loc[a.diff() != 0]
Walau bagaimanapun, pendekatan ini kurang cekap untuk set data yang besar disebabkan oleh overhed yang dikaitkan dengan pengiraan pembezaan.
Kemas kini
Perlu diperhatikan bahawa tempoh peralihan lalai ialah 1, jadi shift() dan shift( 1) menghasilkan hasil yang setara:
a.loc[a.shift(1) != a]
Ini memastikan bahawa nilai berturut-turut pertama dikenal pasti dengan betul sebagai pendua.
Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Pendua Berturut-turut dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!