首頁 > 後端開發 > Python教學 > 如何使用自訂 Bin 來對 Pandas 列進行 Bin 並取得值計數?

如何使用自訂 Bin 來對 Pandas 列進行 Bin 並取得值計數?

Mary-Kate Olsen
發布: 2024-12-12 22:59:15
原創
885 人瀏覽過

How Can I Bin a Pandas Column with Custom Bins and Get Value Counts?

使用自訂的bin 和值計數將pandas 欄位分組

處理數值資料時,將數值分組到bin 中通常很有用檢測模式或趨勢。這個過程稱為分箱,可以使用 pandas 函式庫輕鬆執行。

要對列進行分箱,您可以使用 pandas.cut 函數。以下是它在您提供的範例中的工作原理:

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
登入後複製

此程式碼在您的 DataFrame 中建立一個名為 binned 的新欄位。此列中的每個值代表百分比列中對應數值所屬的 bin。 bins 參數指定 bin 的邊界。

要視覺化值在bin 之間的分佈,可以使用value_counts 函數:

df['binned'].value_counts()
登入後複製

此程式碼將傳回出現的次數每個bin 的值,有效地提供bin 的值計數。

例如,如果您有以下內容資料:

df['percentage'].head()
46.5
44.2
100.0
42.12
登入後複製

並且您使用以下容器:

bins = [0, 1, 5, 10, 25, 50, 100]
登入後複製

df['binned'].value_counts() 的輸出將是:

(25, 50]     3
(50, 100]    1
登入後複製

這表示三個值落在bin (25, 50] 內,一個值落在 bin (50, 100].

以上是如何使用自訂 Bin 來對 Pandas 列進行 Bin 並取得值計數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板