> 백엔드 개발 > 파이썬 튜토리얼 > 여러 값을 기반으로 Pandas DataFrame을 부분 집합하는 방법은 무엇입니까?

여러 값을 기반으로 Pandas DataFrame을 부분 집합하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-12-16 20:37:24
원래의
211명이 탐색했습니다.

How to Subset a Pandas DataFrame Based on Multiple Values?

여러 값을 기반으로 Pandas DataFrame 하위 설정

Pandas에서는 다음 예에서 볼 수 있듯이 특정 값을 기반으로 DataFrame을 하위 설정하는 것이 간단합니다.

import pandas as pd

# Dataframe initialization
df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]})

# Subset based on a single value
x = df[df['A'] == 3]
로그인 후 복사

그러나 값 목록과 일치하는 행을 선택할 때 문제가 발생합니다. 다음 사용 사례를 고려하십시오.

# List of values to filter on
list_of_values = [3, 6]

# Subset attempt (incorrect syntax)
y = df[df['A'] in list_of_values]
로그인 후 복사

Pandas에서는 여러 값을 기반으로 하위 집합을 지정하기 위해 약간 다른 구문이 필요하므로 이 구문에서는 오류가 발생합니다.

해결책: isin() 사용 메서드

값 목록을 기반으로 DataFrame을 부분 집합으로 만드는 올바른 방법은 isin() 메서드를 사용하는 것입니다. 수정된 코드는 다음과 같습니다.

y = df[df['A'].isin(list_of_values)]
로그인 후 복사

출력:

     A  B
1    6  2
2    3  3
로그인 후 복사

isin() 메서드는 값 목록 또는 배열을 입력으로 사용하고 지정된 열이 일치하는 행이 포함된 DataFrame을 반환합니다. 입력의 모든 값.

선택 역순

열 값이 일치하지 않는 행을 선택하려면 제공된 목록에서 isin()과 함께 ~ 연산자를 사용할 수 있습니다. 예:

# Inverse subset
z = df[~df['A'].isin(list_of_values)]
로그인 후 복사

출력:

   A  B
0  5  1
3  4  5
로그인 후 복사

위 내용은 여러 값을 기반으로 Pandas DataFrame을 부분 집합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿