열 값 범위를 기반으로 데이터 프레임 조인
주어진 컨텍스트에는 병합해야 하는 두 개의 데이터 프레임 df_1과 df_2가 있습니다. df_1의 타임스탬프 열이 시작 및 끝 열에 포함되도록 합니다. df_2.
이를 달성하는 한 가지 접근 방식은 df_2의 시작 및 끝 열에서 간격 인덱스를 생성하는 것입니다. 그런 다음 get_loc 메서드를 사용하여 df_1의 각 타임스탬프에 해당하는 이벤트를 얻을 수 있습니다. 이 솔루션에 대한 Python 코드는 다음과 같습니다.
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
이렇게 하면 df_1에 event라는 새 열이 생성됩니다. 여기에는 df_2의 지정된 범위에 속하는 각 타임스탬프에 해당하는 이벤트가 포함되어 있습니다. 결과 조인된 데이터 프레임에는 다음 열이 포함됩니다.
timestamp A B event
출력은 다음과 유사합니다.
timestamp A B event 0 2016-05-14 10:54:33 0.020228 0.026572 E1 1 2016-05-14 10:54:34 0.057780 0.175499 E2 2 2016-05-14 10:54:35 0.098808 0.620986 E2 3 2016-05-14 10:54:36 0.158789 1.014819 E2 4 2016-05-14 10:54:39 0.038129 2.384590 E3
위 내용은 타임스탬프 범위를 기반으로 DataFrame을 조인하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!