> 백엔드 개발 > 파이썬 튜토리얼 > DataFrame 간의 차이점을 쉽게 식별하고 표시하는 방법

DataFrame 간의 차이점을 쉽게 식별하고 표시하는 방법

DDD
풀어 주다: 2024-10-22 20:50:05
원래의
388명이 탐색했습니다.

How to Easily Identify and Display Differences Between DataFrames

데이터 프레임을 비교하고 차이점을 나란히 표시

데이터 불일치를 식별하려면 두 데이터 프레임을 비교해야 하는 경우가 종종 발생합니다. 그리고 그들 사이의 변화를 강조하세요. 다음 예를 고려하십시오.

"StudentRoster Jan-1":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.11                     False                Graduated
113   Zoe    4.12                     True

"StudentRoster Jan-2":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.21                     False                Graduated
113   Zoe    4.12                     False                On vacation
로그인 후 복사

원하는 출력을 얻으려면 먼저 변경된 행을 확인하십시오.

ne = (df1 != df2).any(1)
로그인 후 복사

다음으로 변경된 특정 항목을 식별하십시오.

ne_stacked = (df1 != df2).stack()
changed = ne_stacked[ne_stacked]
changed.index.names = ['id', 'col']
로그인 후 복사

변경된 항목에 대해 원래 값과 업데이트된 값을 추출합니다.

difference_locations = np.where(df1 != df2)
changed_from = df1.values[difference_locations]
changed_to = df2.values[difference_locations]
로그인 후 복사

마지막으로 사용자에게 친숙한 표 형식으로 차이점을 제시합니다.

pd.DataFrame({'from': changed_from, 'to': changed_to}, index=changed.index)
로그인 후 복사

이 접근 방식은 두 데이터프레임 간의 차이점에 대한 포괄적인 요약을 제공하고 변경된 값과 위치를 모두 강조하여 데이터 불일치를 빠르고 효율적으로 분석할 수 있도록 해줍니다.

위 내용은 DataFrame 간의 차이점을 쉽게 식별하고 표시하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿