首頁 > 後端開發 > Python教學 > 如何使用間隔索引連接具有重疊日期時間範圍的資料幀?

如何使用間隔索引連接具有重疊日期時間範圍的資料幀?

Barbara Streisand
發布: 2024-12-15 16:16:15
原創
113 人瀏覽過

How to Join DataFrames with Overlapping Datetime Ranges Using Interval Indexing?

使用區間索引連接具有重疊範圍的資料幀

給定兩個資料幀df_1 和df_2,具有表示日期時間範圍的公共列,我們的目標是使用特定條件加入它們:df_1 的日期時間列值必須落在df_2 中指定的範圍內。

df_1

  timestamp              A          B
0 2016-05-14 10:54:33    0.020228   0.026572
1 2016-05-14 10:54:34    0.057780   0.175499
2 2016-05-14 10:54:35    0.098808   0.620986
3 2016-05-14 10:54:36    0.158789   1.014819
4 2016-05-14 10:54:39    0.038129   2.384590


df_2

  start                end                  event    
0 2016-05-14 10:54:31  2016-05-14 10:54:33  E1
1 2016-05-14 10:54:34  2016-05-14 10:54:37  E2
2 2016-05-14 10:54:38  2016-05-14 10:54:42  E3
登入後複製

解:

我們可以使用區間索引來實現這一點。間隔索引根據 df_2 中指定的範圍建立 bin,並將標籤指派給 df_1 中屬於這些 bin 的時間戳記。

import pandas as pd

# Convert start and end columns to IntervalIndex
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Get the event associated with each timestamp in df_1
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
登入後複製

輸出:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3
登入後複製

以上是如何使用間隔索引連接具有重疊日期時間範圍的資料幀?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板