Pandas 중복 제거 방법은 다음과 같습니다. 1. drop_duplicates() 메서드를 사용합니다. 2. Duplicate() 메서드를 사용합니다. 4. value_counts() 메서드를 사용합니다. 자세한 소개: 1. drop_duplicates() 메서드를 사용하여 데이터 프레임에서 중복 행을 삭제하고 새 데이터 프레임을 반환합니다. 중복 제거 후 중복 제거 및 보존 순서 지정과 같은 중복 제거 수행 방법을 제어하는 매개변수를 설정할 수 있습니다. 열 등.
이 튜토리얼의 운영 체제: Windows 10 시스템, DELL G3 컴퓨터.
Pandas는 다양한 중복 제거 방법을 제공하는 강력한 Python 데이터 분석 라이브러리입니다. 다음은 Pandas를 사용하여 중복 제거 작업을 위한 일반적인 방법입니다.
1. drop_duplicates() 메서드를 사용하세요.
drop_duplicates() 메서드는 데이터 프레임에서 중복 행을 삭제하고 새 데이터 프레임을 반환하는 데 사용됩니다. 중복 제거 후 보존 순서 지정, 중복 제거 중 비교 열 지정 등 중복 제거 수행 방법을 제어하는 매개변수를 설정할 수 있습니다.
샘플 코드:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.drop_duplicates() # 默认情况下,按行进行去重,返回新的数据框
2.duplicate() 메서드 사용
duplicate() 메서드는 데이터 프레임에서 중복 행을 찾아 부울 계열을 반환하는 데 사용됩니다. 중복 제거 후 보존 순서 지정, 중복 제거 중 비교 열 지정 등 중복 제거 수행 방법을 제어하는 매개변수를 설정할 수 있습니다.
샘플 코드:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df[~df.duplicated()] # 使用duplicated()方法查找重复的行,并使用逻辑非运算符返回不重复的行
3. Unique() 메서드 사용
unique() 메서드는 데이터 프레임의 모든 고유 값을 반환하고 목록 또는 Series 객체를 반환하는 데 사용됩니다. 단일 또는 여러 열의 중복을 제거하는 데 사용할 수 있습니다.
샘플 코드:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.apply(lambda x: pd.Series(x.unique())) # 使用apply()方法对每一列进行去重,并返回一个Series对象
4. value_counts() 메서드 사용
value_counts() 메서드는 데이터 프레임에서 각 값의 발생 횟수를 계산하고 Series 개체를 반환하는 데 사용됩니다. 단일 또는 여러 열의 중복을 제거하는 데 사용할 수 있습니다.
샘플 코드:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.groupby(df.columns.tolist()).size().reset_index(name='counts') # 对整个数据框进行分组计数,并返回一个Series对象,然后使用reset_index()方法转换为数据框格式,方便查看每个值的出现次数
위 내용은 팬더에서 중복을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!