> 백엔드 개발 > 파이썬 튜토리얼 > Pandas 시리즈에서 연속 중복을 제거하는 방법은 무엇입니까?

Pandas 시리즈에서 연속 중복을 제거하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-11-13 01:49:02
원래의
441명이 탐색했습니다.

How to Remove Consecutive Duplicates in a Pandas Series?

Pandas에서 연속 중복 항목 삭제

Pandas 시리즈에서 연속 중복 항목을 제거하려면 여러 가지 방법을 사용할 수 있습니다.

방법 1: Shift 사용

가장 효율적인 접근 방식은 Shift() 함수를 활용하는 것입니다.

a.loc[a.shift() != a]
로그인 후 복사

이 방법은 시리즈를 자체 Shift 버전과 비교합니다. 연속된 중복 항목을 식별하는 부울 마스크를 생성합니다.

방법 2: Diff 사용

다른 방법은 diff() 함수를 사용하는 것입니다.

a.loc[a.diff() != 0]
로그인 후 복사

그러나 이 접근 방식은 대규모 데이터 세트의 경우 약간 느립니다.

업데이트:

shift()를 기본 기간으로 사용한다는 점에 유의하는 것이 중요합니다. 1은 Shift(1)과 동일합니다. 따라서 다음 코드도 원하는 출력을 생성합니다.

a.loc[a.shift(1) != a]
로그인 후 복사

이러한 방법을 활용하면 Pandas Series에서 연속 중복 항목을 효과적으로 제거하여 고유한 값만 유지되도록 할 수 있습니다.

위 내용은 Pandas 시리즈에서 연속 중복을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿