> 백엔드 개발 > 파이썬 튜토리얼 > 데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?

데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-11-04 10:41:30
원래의
647명이 탐색했습니다.

How to Extract Rows Based on Distinct Values in a Dataframe Column?

데이터 프레임 열에서 고유 값 쿼리

데이터 프레임으로 작업할 때 데이터 프레임의 고유 값을 기반으로 행을 검색해야 하는 경우가 종종 있습니다. 특정 열. 이를 통해 중복 값을 제거하고 고유한 데이터 포인트 세트를 얻을 수 있습니다.

다음 데이터프레임을 고려하세요.

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45
로그인 후 복사

열의 고유 값에 해당하는 행을 추출한다고 가정합니다. COL2. 이를 달성하기 위해 pandas의 drop_duplicates 기능을 활용할 수 있습니다. 이 함수는 열 이름을 인수로 사용하고 데이터 프레임에서 중복 행을 제거합니다.

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>
로그인 후 복사

기본적으로 drop_duplicates는 각 고유 값의 첫 번째 항목을 유지합니다. 또는 keep='last'를 지정하여 마지막 항목을 유지하거나 keep=False를 지정하여 모든 중복 행을 제거할 수 있습니다.

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>
로그인 후 복사

위 명령 중 하나를 실행한 후 데이터 프레임 df에는 해당 행만 포함됩니다. COL2 열의 고유 값에 해당:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56
로그인 후 복사

위 내용은 데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿