pandas 中的 for 循环真的很糟糕吗?我什么时候应该关心?
For 循环在 pandas 中并不是天生“坏”的。在某些情况下,它们比使用更传统的“矢量化”方法具有优势。在以下情况下考虑使用 for 循环:
-
处理小数据:向量化函数会带来处理索引/轴对齐、混合数据类型和丢失数据的开销。对于小型数据集,for 循环可能会更快。
-
处理对象/混合数据类型:Pandas 将字符串视为对象,而字符串操作本质上很难矢量化。列表推导式通常优于具有混合数据类型的向量化方法。
-
使用 str/regex 访问器函数:向量化字符串操作(例如 str.contains)可能比预编译正则表达式模式慢并使用 re.compile 迭代数据。
以上是Pandas For 循环总是不好吗?我什么时候应该使用它们?的详细内容。更多信息请关注PHP中文网其他相关文章!