根據Pandas 中的公式動態計算表達式
使用pd.eval 對一個或多個資料幀列上的算術表達式進行計算是一項常見任務,尤其是在自動化時工作流程。考慮以下程式碼片段:
`x = 5
df2['D'] = df1['A'] (df1['B'] * x)``
此程式碼透過對df1 中的A 列和B 列執行操作並將結果乘以變數x,將新列D 新增到df2。目標是動態重複此資料操作,利用 pd.eval 將表達式作為字串執行的能力。
首先,讓我們介紹輸入DataFrame:
import pandas as pd import numpy as np np.random.seed(0) df1 = pd.DataFrame(np.random.choice(10, (5, 4)), columns=list('ABCD')) df2 = pd.DataFrame(np.random.choice(10, (5, 4)), columns=list('ABCD')) df1 A B C D 0 5 0 3 3 1 7 9 3 5 2 2 4 7 6 3 8 8 1 6 4 7 7 8 1 df2 A B C D 0 5 9 8 9 1 4 3 0 3 2 5 0 2 3 3 8 1 3 3 4 3 7 0 1
使用動態評估表達式pd.eval,可以使用以下程式碼:
result = pd.eval(' df1.A (df1.B * x)')
這行程式碼建立一個名為result 的新DataFrame,其中包含計算後的表達式。 eval函數也可以用來進行條件求值,如:
pd.eval('df1.A > df2.A')
將表達式的結果賦值回歸df2,請使用下列語法:
df2['D'] = pd.eval('df1.A (df1.B * x)', target=df2)
要在表達式字串內傳遞參數,請使用@ 符號:
pd.eval('df1.A (df1. B * @x)', local_dict ={'x': 5})
為了獲得最佳效能,請考慮以下事項參數:
parser='python' 用於控制語法規則並確保與 Python 運算子優先權的一致性。
engine='numexpr' 用於使用最佳化的 numexpr 後端進行更快的評估。
這應該為您提供全面了解如何使用 pd.eval 從 Pandas 中的公式動態計算表達式。
以上是如何使用 pd.eval 動態評估 Pandas 中公式的表達式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!