首頁 > 後端開發 > Python教學 > 如何在 Pandas DataFrame 中有效地選擇具有最小列值的行?

如何在 Pandas DataFrame 中有效地選擇具有最小列值的行?

Linda Hamilton
發布: 2024-10-26 17:36:02
原創
473 人瀏覽過

How to Efficiently Select Rows with Minimum Column Values in Pandas DataFrames?

Pandas GroupBy 和高效選擇具有最小列值的行

使用Pandas DataFrame 時,根據特定列值選擇行是常見的任務。在需要提取特定列中具有最小值的行的情況下,有一個簡單而有效的方法可以實現此目的。

為了說明這一點,請考慮以下DataFrame:

df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [4, 5, 2, 7, 4, 6],
                   'C': [3, 4, 10, 2, 4, 6]})
登入後複製

要為A 的每個值選擇B 列中最小值的行,我們可以使用groupby 和idxmin 方法:

minimum_rows = df.loc[df.groupby('A').B.idxmin()]
登入後複製

此運算會依A 欄位對DataFrame 進行分組並識別該行的索引B 欄位中每組的最小值。然後 loc 方法會提取這些行以建立minimum_rows DataFrame。

   A  B   C
2  1  2  10
4  2  4   4
登入後複製

如果您希望重設索引以確保連續的整數,可以使用reset_index方法:

minimum_rows.reset_index(drop=True)

   A  B   C
0  1  2  10
1  2  4   4
登入後複製

透過利用groupby 和idxmin 方法,您可以有效地選擇指定列中具有最小值的行,而不需要MultiIndex 或複雜的操作。

以上是如何在 Pandas DataFrame 中有效地選擇具有最小列值的行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板