pandas 中的 for 迴圈真的很糟嗎?我什麼時候該關心?
For 循環在 pandas 中並不是天生「壞」的。在某些情況下,它們比使用更傳統的「向量化」方法具有優勢。在以下情況下考慮使用 for 迴圈:
-
處理小資料:向量化函數會帶來處理索引/軸對齊、混合資料類型和遺失資料的開銷。對於小型資料集,for 迴圈可能會更快。
-
處理對象/混合資料類型:Pandas 將字串視為對象,而字串運算本質上很難向量化。列表推導式通常優於具有混合資料類型的向量化方法。
-
使用 str/regex 存取器函數:向量化字串操作(例如 str.contains)可能比預編譯正規表示式模式慢並使用 re.compile 迭代資料。
以上是Pandas For 循環總是不好嗎?我什麼時候應該使用它們?的詳細內容。更多資訊請關注PHP中文網其他相關文章!