社群學習工具庫休閒

繁体中文

首頁 > 後端開發 > Python教學 > 如何辨識 Pandas DataFrame 中的所有重複行？

如何辨識 Pandas DataFrame 中的所有重複行？

Barbara Streisand

發布： 2024-10-25 15:15:02

原創

1112 人瀏覽過

How to Identify All Duplicate Rows in a Pandas DataFrame?

如何在 Python 中使用 Pandas 取得所有重複項的清單？

問題：

您的 Pandas DataFrame 包含重複行，但使用 duplicated() 方法只傳回第一個重複實例。您需要所有出現的重複行的完整清單以進行手動比較。

解 1：隔離具有重複 ID 的行

將 Pandas 匯入為 pd。
將資料讀入 DataFrame df。
將 ID 欄位擷取到單獨的 Series id 中。
根據ID 值是否與中的任何重複ID 匹配來過濾df ids[ids.duplicated()]:

雖然此方法有效檢索所有重複行，但它會在輸出中建立重複的ID 行。

解決方案 2 ：按 ID 分組並過濾重複項

在 df 上使用 groupby("ID") 將行分組依 ID 值分組。
過濾結果組以僅保留具有多行的：

這種方法會產生精簡的輸出，沒有多餘的 ID 行。

以上是如何辨識 Pandas DataFrame 中的所有重複行？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

來源：php.cn

上一篇：如何在Python中判斷文字檔是否為空？下一篇：## Flatten 與 Ravel：什麼時候應該使用每個 Numpy 函數？

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

最新問題

function_exists()無法判定自訂函數 function test() { return true; } if (function_exists('TEST')) { ech...

來自於 2024-04-29 11:01:01

0

3

2313

google 瀏覽器手機版顯示的怎麼實現老師您好，google 瀏覽器怎麼變成手機版樣式的？

來自於 2024-04-23 00:22:19

0

11

2448

子窗口操作父窗口，輸出沒反應前兩句可執行，最後一句沒辦法應

來自於 2024-04-19 15:37:47

0

1

2064

父視窗沒有輸出 document.onclick = function(){ window.opener.document.write('我是子視窗的輸出'); ...

來自於 2024-04-18 23:52:34

0

1

1949

關於CSS心智圖的課件在哪？課件

來自於 2024-04-16 10:10:18

0

0

2015

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1425064
php入門教程之一週學會PHP

4271404
JAVA 初級入門影片教學

2552132
小甲魚零基礎入門學習Python影片教學

508489
PHP 零基礎入門教學

864087

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板