부트스트랩은 통계의 변동성을 추정하고 통계의 간격을 추정할 수 있는 비모수 통계에서 중요한 통계 방법입니다.
핵심 아이디어와 기본 단계는 다음과 같습니다. (추천 학습: Bootstrap 비디오 튜토리얼)
(1) 반복 샘플링 기술을 사용하여 원본 샘플에서 특정 숫자를 추출합니다(주실 수 있음). 일반적으로 이 과정을 통해 원본 샘플과 동일한 샘플을 반복적으로 샘플링할 수 있습니다.
(2) 추출된 샘플을 기반으로 추정할 통계 T를 계산합니다.
(3) 위의 작업을 N회(일반적으로 1000보다 큼) 반복하여 N개의 통계 T를 얻습니다.
(4) 위 N 통계량 T의 표본 분산을 계산하여 통계량 T의 분산을 추정합니다.
부트스트랩은 현대 통계에서 널리 사용되는 통계 방법이며, 작은 표본으로 작업할 때 잘 작동한다고 해야 할까요. 분산추정을 통해 신뢰구간을 구축할 수 있으며, 적용 범위가 더욱 확장됩니다.
구체적인 샘플링 방법의 예: 연못에 있는 물고기의 수를 알고 싶다면 먼저 N마리의 물고기를 추출하고 표시한 후 다시 연못에 넣을 수 있습니다.
반복 샘플링을 수행하고 M회 추첨하고 매번 N개의 물고기를 추첨하여 매번 표시가 있는 물고기의 비율을 조사하고 M회의 비율을 기준으로 통계를 계산합니다.
데이터에 명백한 레이어가 있는 경우 계층화 샘플링을 사용하여 분석 효율성을 높일 수 있습니다. spss는 기본적으로 비모수적 부트스트랩 방법을 사용하고 완전 무작위 샘플링을 사용합니다. 따라서 계층화 샘플링이 필요한 경우 기본값을 사용할 수 없습니다. 직접 설정해야 합니다.
가장 과학적이고 합리적이기 위해서는 얼마나 많은 관찰이 필요한지에도 특별한 주의가 필요합니다. 답은 1,000입니다. 이 숫자보다 작으면 백분위수법에 따라 신뢰구간을 계산하기 때문에 계산 결과가 정확하지 않으므로 너무 작을 수는 없습니다. 1000개 이상이면 대부분의 경우 정확도 향상이 매우 제한되며 시스템 리소스와 컴퓨팅 시간이 낭비됩니다.
부트스트랩의 spss 분석 작업 단계: "분석" ~ "평균 비교" ~ "평균" ~ 독립 변수 및 종속 변수 선택 ~ "옵션" 하위 대화 상자 ~ "셀 통계" ~ 부트스트랩 하위 대화 상자 ~ 부트스트랩 확인란 실행
한 가지 더, 종속 변수가 정규 분포를 따르거나 대략 일치하면 부트스트랩 방법을 사용할 필요가 없습니다.
Bootstrap과 관련된 더 많은 기술 기사를 보려면 Bootstrap Tutorial 칼럼을 방문하여 알아보세요!
위 내용은 부트스트랩 알고리즘은 무엇을 의미하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!