2표본 t-검정을 사용하여 두 평균 집합을 통계적으로 비교하여 두 평균 사이에 유의미한 차이가 있는지 확인하세요. 이 테스트는 연속 변수를 기반으로 두 그룹이 크게 다른지 여부를 확인하기 위해 과학 연구에서 자주 사용됩니다. 이 기사에서는 Python의 scipy.stats 모듈을 사용하여 2-표본 t-검정을 수행하는 방법을 알아봅니다.
구현을 진행하기 전에 먼저 2-표본 t-검정의 이론적 기초를 이해하겠습니다. 이 테스트에서는 두 표본 모집단이 정규 분포를 따르고 유사한 분산을 갖는다고 가정합니다. 귀무가설은 두 그룹의 평균이 동일하다는 것이고, 대립가설은 두 그룹의 평균이 동일하지 않다는 것입니다. 검정 통계량은 두 그룹 간의 평균 차이를 표준 오차의 차이로 나누어 계산됩니다. 귀무가설을 기각하고 추정된 t-값이 임계값보다 높으면 두 그룹의 평균이 크게 다르다는 결론을 내립니다.
Python에서 2표본 t-검정을 수행하는 방법을 살펴보겠습니다. ttest_ind라는 함수를 제공하는 데 도움이 되는 scipy.stats 모듈이 필요합니다. 두 개의 샘플을 나타내는 두 개의 배열을 입력으로 사용하고 t 및 p 값을 반환합니다.
필요한 라이브러리를 가져오는 것이 첫 번째 단계입니다. Python에서 2-표본 t-검정을 수행하려면 NumPy 및 SciPy 라이브러리를 가져와야 합니다. 통계 연산은 SciPy 라이브러리를 사용하여 수행되었으며, 수학적 연산은 NumPy 라이브러리를 사용하여 수행되었습니다.
으아악다음으로 평균과 표준편차가 동일한 두 개의 무작위 표본을 만들어 보겠습니다. -
으아악여기에서는 np.random.normal 함수를 사용하여 각각 크기가 100이고 평균이 10이고 표준 편차가 2인 두 개의 샘플을 생성합니다. 재현 가능한 결과를 보장하기 위해 무작위 시드를 42로 설정했습니다.
이제 t-test를 해보자 -
으아악ttest_ind 함수는 t-값과 p-값이라는 코드와 함께 두 가지 값을 반환합니다. t-값은 두 표본 평균 간의 차이를 측정하는 반면, p-값은 차이의 통계적 유의성을 측정합니다.
마지막으로 결과를 인쇄해 볼까요 -
으아악이것은 t-값과 p-값을 출력합니다 -
으아악이 코드의 t 값은 작기 때문에 두 표본의 평균이 상당히 비슷하다는 결론을 내릴 수 있습니다. p-값이 너무 크기 때문에 두 값의 차이는 똑같이 유의하지 않습니다.
t-검정은 두 그룹의 분산이 동일하다고 가정한다는 점을 기억하세요. 이 가정이 깨지는 경우 등분산을 가정하지 않는 t-검정의 변형인 Welch의 t-검정을 사용할 수 있습니다. Welch의 t-검정에 대한 ttest_ind_from_stats 방법은 scipy.stats 모듈에서도 사용할 수 있습니다. 두 그룹의 평균, 표준 편차 및 표본 크기가 이 함수의 입력입니다.
이것은 t-값과 p-값을 출력합니다 -
으아악데이터에 따르면 이 예의 t 값은 음수입니다. 이는 표본 1의 평균이 표본 2의 평균보다 약간 낮음을 나타냅니다. 그러나 p-값이 매우 높으면 평균의 차이가 통계적으로 유의하지 않다는 것을 나타냅니다.
결론적으로 2-표본 t-검정은 두 그룹의 평균을 비교하고 유의미한 차이가 있는지 확인할 수 있는 효과적인 통계 도구입니다. Python에는 이 기사에서 사용하는 scipy.stats 모듈을 포함하여 t-테스트를 수행하기 위한 많은 라이브러리와 함수가 있습니다. t-검정은 정규성 및 등분산을 포함하여 검정을 실행하기 전에 확인해야 하는 다양한 가정을 합니다. 또한, 결과를 해석할 때 고려 중인 특정 연구 문제와 연구의 한계를 항상 고려해야 합니다.
위 내용은 Python에서 2-표본 t-검정을 어떻게 수행하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!