맞춤형 Bin 및 값 개수로 Pandas 열 Binning
숫자 데이터로 작업할 때 값을 Bin으로 그룹화하는 것이 유용한 경우가 많습니다. 패턴이나 추세를 감지합니다. 비닝이라고 하는 이 프로세스는 pandas 라이브러리를 사용하여 쉽게 수행할 수 있습니다.
열을 비닝하려면 pandas.cut 함수를 사용할 수 있습니다. 제공하신 예제의 작동 방식은 다음과 같습니다.
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
이 코드는 DataFrame에 binned라는 새 열을 생성합니다. 이 열의 각 값은 백분율 열의 해당 숫자 값이 속하는 구간을 나타냅니다. bins 매개변수는 bin의 경계를 지정합니다.
bin 전체의 값 분포를 시각화하려면 value_counts 함수를 사용할 수 있습니다.
df['binned'].value_counts()
이 코드는 발생 횟수를 반환합니다. 각 bin의 값 개수를 효과적으로 제공합니다.
예를 들어 다음과 같은 경우 data:
df['percentage'].head() 46.5 44.2 100.0 42.12
다음 bin을 사용합니다.
bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'].value_counts()의 출력은 다음과 같습니다.
(25, 50] 3 (50, 100] 1
이는 세 개의 값이 bin(25, 50]에 속하고 하나의 값이 bin(50, 100].
위 내용은 사용자 정의 저장소를 사용하여 Pandas 열을 분류하고 값 개수를 얻으려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!