使用多列引用对 Pandas 'apply' 函数进行故障排除
尝试将自定义函数应用于 Pandas DataFrame 中的多个列, “apply”函数遇到 NameError。
错误消息“全局名称 'a' 未定义”表示在函数内无法访问 'a' 变量。经过仔细检查,发现列名应该用引号引起来,如 'row['a']'。
更正后的代码应如下所示:
<code class="python">df['Value'] = df.apply(lambda row: my_test(row['a'], row['c']), axis=1)</code>
但是,即使解决了此语法错误,代码在使用更复杂的函数时仍然会失败。这表明了一个不同的问题。
所提供函数中的关键步骤是迭代 DataFrame 的索引并将参数“a”与列“a”中的每个值进行比较。要访问这些元素,应按如下方式调整语法:
<code class="python">def my_test(a): cum_diff = 0 for ix in df.index: cum_diff += (a - df['a'][ix]) return cum_diff</code>
通过合并这些更正,代码现在应该按预期运行。
以上是将函数应用于 Pandas 中的多列时如何解决名称错误?的详细内容。更多信息请关注PHP中文网其他相关文章!