Pandas 조건부 대체
DataFrame을 조작할 때 특정 기준에 맞는 값을 대체해야 할 수도 있습니다. 이 질문의 목적은 특정 열 내에서 임계값을 초과하는 값을 0으로 바꾸는 방법을 다루는 것입니다.
원래 접근 방식 및 제한 사항
초기 접근 방식은 df 구문을 사용하려고 시도했습니다. [df.my_channel > 20000].my_channel = 0. 그러나 이 접근 방식은 사용자가 관찰한 대로 원본 DataFrame 내에서 작업할 때 문제에 직면합니다.
.loc 인덱서를 사용한 솔루션
To 이 문제를 해결하려면 최신 버전의 Pandas에서 권장되는 .loc 인덱서를 활용할 수 있습니다. 이 구문을 사용하면 정확한 행과 열을 선택하고 변경할 수 있습니다. 원하는 대체를 수행하려면 다음 코드를 사용할 수 있습니다.
mask = df.my_channel > 20000 column_name = 'my_channel' df.loc[mask, column_name] = 0
또는 코드를 한 줄로 압축할 수도 있습니다.
df.loc[df.my_channel > 20000, 'my_channel'] = 0
설명
마스크 변수는 df.my_channel이 20000을 초과하는 행을 선택합니다. 이어서 df.loc[mask, column_name] = 0은 마스크가 True인 행에 대해 my_channel 열을 0으로 설정합니다.
참고
반드시 사용해야 합니다. 이 경우 .loc 인덱서는 정수 유형 열에서 부울 인덱싱과 함께 .iloc를 사용하면 NotImplementedError.
위 내용은 임계값을 초과하는 Pandas DataFrame 값을 0으로 효율적으로 바꾸는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!