정규화된 열: 범위 내 값 유지
데이터 분석의 경우 값이 범위 내에 있는 경우가 많아 해석이 약간 틀리게 됩니다. 어려운. 정규화는 값을 0과 1 사이의 일관된 척도로 변환하여 해결됩니다.
예제 데이터 프레임을 고려해 보겠습니다.
df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09
해결책 1: 평균 정규화
Pandas를 사용하면 평균과의 편차를 계산하고 이를 표준 편차로 표준화하여 열을 정규화할 수 있습니다.
normalized_df = (df - df.mean()) / df.std()
이 결과는 다음과 같습니다.
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
해결책 2: 최소-최대 정규화
또는 데이터의 최소값과 최대값을 기준으로 값을 조정하는 최소-최대 정규화를 수행할 수 있습니다.
normalized_df = (df - df.min()) / (df.max() - df.min())
결과 in:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Pandas는 자동으로 열 단위로 정규화를 적용하여 프로세스를 효율적이고 간단하게 만듭니다.
위 내용은 정규화를 사용하여 범위 내에서 데이터 값을 유지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!