連接重疊日期時間範圍的資料幀
給定兩個資料幀df_1 和df_2,其中df_1 有一個時間戳列, df_2 有開始和結束表示日期時間範圍的列,目標是連接資料框基於df_1 中的時間戳記列落在df_2 中的開始列和結束列定義的範圍內的條件。
為了實現這一點,一個有效的解決方案是利用 Pandas 的 IntervalIndex 根據開始和結束欄位對 df_2 進行索引最終值。透過在 IntervalIndex 中設定 close='both',我們確保包含間隔的端點。
接下來,我們可以利用 get_loc 方法來辨識與 df_1 中給定時間戳記相對應的間隔。使用這種方法,我們可以從 df_2 中取得與該時間範圍相關的對應事件。
透過將此程序應用於 df_1 中的每一行,我們可以將適當的事件值分配給新列,從而有效地連接兩個列基於指定的日期時間範圍標準的資料幀。
此解決方案提供了一種簡單而有效的方法,用於根據重疊的日期時間在資料幀之間執行複雜的連接間隔。
以上是如何根據重疊的日期時間範圍有效地連接 DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!