使用条件值创建新列
分析数据时,可能需要创建新列,其中的值是根据条件选择的现有的列。这允许您对数据进行分类或转换以进行进一步分析或可视化。这里有两种方法:
np.where 有两种选择:
如果您需要根据现有列仅在两个值之间进行选择,您可以使用 np .where 函数。例如,要在数据框中创建一个“颜色”列,其中“Set=='Z'”则为“color='green'”,否则为“color='red'”,您可以使用:
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
np.select 用于多个条件:
如果在选择值时要考虑两个以上的条件,则可以使用 np.select 功能。例如,要基于多个条件创建“颜色”列:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
通过使用 np.where 或 np.select,您可以轻松创建具有条件值的新列,从而提供数据操作和操作的灵活性从您的数据中获得更深入的见解。
以上是如何使用 NumPy 在 DataFrame 中创建带有条件值的新列?的详细内容。更多信息请关注PHP中文网其他相关文章!