根據列值範圍連接DataFrame
在給定的上下文中,我們有兩個資料幀df_1 和df_2,我們需要在其中合併它們使得df_1中的時間戳列落在中的開始列和結束列內df_2.
實現此目的的一種方法是從 df_2 中的開始列和結束列建立區間索引。然後我們可以使用 get_loc 方法來取得 df_1 中每個時間戳對應的事件。以下是此解決方案的 Python 程式碼:
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
這將在 df_1 中建立一個名為 event 的新列,其中包含 df_2 中指定範圍內的每個時間戳記的相應事件。產生的連接資料框將包含以下列:
timestamp A B event
輸出將類似於:
timestamp A B event 0 2016-05-14 10:54:33 0.020228 0.026572 E1 1 2016-05-14 10:54:34 0.057780 0.175499 E2 2 2016-05-14 10:54:35 0.098808 0.620986 E2 3 2016-05-14 10:54:36 0.158789 1.014819 E2 4 2016-05-14 10:54:39 0.038129 2.384590 E3
以上是如何根據時間戳記範圍連接DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!