使用條件值建立新欄位
分析資料時,可能需要建立新列,其中的值是根據條件選擇的現有的列。這允許您對資料進行分類或轉換以進行進一步分析或視覺化。這裡有兩種方法:
np.where 有兩種選擇:
如果您需要根據現有列僅在兩個值之間進行選擇,您可以使用np .where 函數。例如,要在資料框中建立一個“顏色”列,其中“Set=='Z'”則為“color='green'”,否則為“color='red'”,您可以使用:
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
np.select 用於多個條件:
如果在選擇值時要考慮兩個以上的條件,則可以使用np.select功能。例如,要基於多個條件建立「顏色」列:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
透過使用np.where 或np.select,您可以輕鬆建立具有條件值的新列,從而提供資料操作和操作的靈活性從您的數據中獲得更深入的見解。
以上是如何使用 NumPy 在 DataFrame 中建立帶有條件值的新欄位?的詳細內容。更多資訊請關注PHP中文網其他相關文章!