지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > Pandas에서 연속 중복을 제거하는 방법은 무엇입니까?

Pandas에서 연속 중복을 제거하는 방법은 무엇입니까?

Barbara Streisand

풀어 주다： 2024-11-15 04:09:02

원래의

196명이 탐색했습니다.

How to Remove Consecutive Duplicates in Pandas?

Pandas에서 연속 중복 제거

Pandas의 drop_duplicates() 메소드는 모든 중복 값을 제거하는 데 효과적이지만 연속 발생을 식별하지는 않습니다. . 이러한 제한을 해결하기 위해 연속된 중복 항목만 선택적으로 삭제하는 효율적인 방법이 있습니다.

한 가지 접근 방식은 시프트 기능을 사용하여 현재 값을 이전 값과 비교합니다.

a.loc[a.shift() != a]

로그인 후 복사

이 논리는 다음을 반환합니다. 연속된 중복이 False 값으로 특성화되는 마스크입니다. 그런 다음 loc 방법은 True 값이 있는 행만 선택하여 연속 중복 항목을 효과적으로 제거합니다.

또 다른 방법은 diff 기능을 활용하여 변경 사항을 감지합니다.

a.loc[a.diff() != 0]

로그인 후 복사

그러나 이 접근 방식은 덜 효율적입니다. 미분 계산과 관련된 오버헤드로 인해 대규모 데이터 세트의 경우

업데이트

기본 이동 기간이 1이므로 Shift() 및 Shift( 1) 동일한 결과 생성:

a.loc[a.shift(1) != a]

로그인 후 복사

이렇게 하면 첫 번째 연속 값이 중복 항목으로 올바르게 식별됩니다.

위 내용은 Pandas에서 연속 중복을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천：php.cn

이전 기사：Python에서 점 표기법을 사용하여 사전 멤버에 액세스할 수 있습니까? 다음 기사：1D NumPy 배열을 전치하면 어떻게 되나요?

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

최신 이슈

function_exists()는 사용자 정의 함수를 결정할 수 없습니다. 기능 테스트() { ...

에서 2024-04-29 11:01:01

0

3

2240

Chrome 모바일 버전을 표시하는 방법 안녕하세요 선생님, Chrome을 모바일 버전으로 어떻게 변경하나요?

에서 2024-04-23 00:22:19

0

11

2380

자식 창이 부모 창을 작동하지만 출력이 응답하지 않습니다. 처음 두 문장은 실행 가능하지만 마지막 문장은 구현할 수 없습니다.

에서 2024-04-19 15:37:47

0

1

1989

상위 창에 출력이 없습니다. document.onclick = function(){ window.opener.document.write('나는 자식 창의 출력입니다.');

에서 2024-04-18 23:52:34

0

1

1877

CSS 마인드맵 코스웨어는 어디에 있나요? 코스웨어

에서 2024-04-16 10:10:18

0

0

1947

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿