使用自訂的bin 和值計數將pandas 欄位分組
處理數值資料時,將數值分組到bin 中通常很有用檢測模式或趨勢。這個過程稱為分箱,可以使用 pandas 函式庫輕鬆執行。
要對列進行分箱,您可以使用 pandas.cut 函數。以下是它在您提供的範例中的工作原理:
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
此程式碼在您的 DataFrame 中建立一個名為 binned 的新欄位。此列中的每個值代表百分比列中對應數值所屬的 bin。 bins 參數指定 bin 的邊界。
要視覺化值在bin 之間的分佈,可以使用value_counts 函數:
df['binned'].value_counts()
此程式碼將傳回出現的次數每個bin 的值,有效地提供bin 的值計數。
例如,如果您有以下內容資料:
df['percentage'].head() 46.5 44.2 100.0 42.12
並且您使用以下容器:
bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'].value_counts() 的輸出將是:
(25, 50] 3 (50, 100] 1
這表示三個值落在bin (25, 50] 內,一個值落在 bin (50, 100].
以上是如何使用自訂 Bin 來對 Pandas 列進行 Bin 並取得值計數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!