Pandas 中的條件值替換
在 Pandas 中使用 DataFrame 時,通常需要根據某些條件選擇性地修改值。一個常見的任務是替換特定列中超過特定閾值的值。
之前使用 df[df.my_channel > 的嘗試20000].my_channel = 0 語法在作為原始 DataFrame 的一部分時被證明不成功。這是由於 Pandas 0.20.0 中引入的索引變更所致,它棄用了 .ix 索引器。
為了解決這個問題,我們可以利用.loc 索引器,它提供了另一種存取和修改行和列的方法
mask = df.my_channel > 20000 column_name = 'my_channel' df.loc[mask, column_name] = 0
這段程式碼透過先建立一個布爾遮罩(mask)來實現想要的結果,其中每個值對應於df.my_channel 欄位中對應的值是否超過20000。然後我們使用 .loc 來選擇 mask 為 True 的行,並將值 0 分配給 column_name 列。
作為替代方案,以下可以使用-line 程式碼片段:
df.loc[df.my_channel > 20000, 'my_channel'] = 0
在這種情況下,使用.loc 而不是.iloc 很重要(基於整數位置的索引)以避免NotImplementedError。
以上是如何根據條件閾值高效替換 Pandas DataFrame 中的值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!