ブートストラップ法とは何を意味しますか?
ブートストラップ法は、非環境における統計的変動性の重要な推定です。パラメトリック統計。ブートストラップ法とも呼ばれる、統計量の間隔を推定できる統計手法です。
核となるアイデアと基本的な手順は次のとおりです。
(1) 反復サンプリング技術を使用して、一定数のサンプルを抽出します (自分で指定することもでき、通常は元のサンプルと同じです)このプロセスにより、サンプリングを繰り返し行うことができます。
(2) 抽出したサンプルに基づいて推定する統計量 T を計算します。
(3) 上記を N 回 (通常は 1000 回以上) 繰り返して、N 個の統計 T を取得します。
(4) 上記 N 個の統計量 T の標本分散を計算し、統計量 T の分散を推定します。
ブートストラップは現代の統計で人気のある統計手法であり、小さなサンプルでうまく機能するということを言っておきます。信頼区間は分散の推定によって構築でき、その適用範囲はさらに拡張されます。
具体的なサンプリング方法の例: 池の中の魚の数を知りたい場合は、まず N 匹の魚を抽出し、それらにマークを付けて、池に戻すことができます。
繰り返しサンプリングを行い、M 回抽出し、毎回 N 匹抽出し、毎回抽出された魚のうち、マークされた魚の割合を調べ、M 回の割合に基づいて統計を計算します。
ブートストラップを適用する理由: 実際、分析を実行するときに最初に行うことは、確率変数の種類を決定し、次に確率変数のデータがどのような分布に従うかを決定することです。どのような分布が分析できるかどうかが直接決まるため、どのような分布が重要であるかが重要です。例: 分散分析を実行する場合は、まず正規分布を要求する必要があります。正規分布でない場合は、是正措置を講じる必要があります。この是正措置はブートストラップです。ブートストラップには別の用途もあります。古典的な統計は中心傾向については比較的完璧ですが、中央値、四分位数、標準偏差、変動係数などの他の分布パラメータの区間推定には完璧ではないため、ブートストラップが必要です。 。 この方法。ブートストラップは古典的な統計手法に似ています。一般に、パラメトリック手法はノンパラメトリック手法よりも効率的です。ただし、パラメトリック手法の最大の欠点は、事前に分布モデルが必要であることです。モデルが準拠していない場合は、モデルの解析結果が間違っている可能性があり、これは白解析です。
データに明らかな層がある場合、層化サンプリングを使用して分析効率を向上できます。spss はデフォルトでノンパラメトリック ブートストラップ法を使用し、完全にランダムなサンプリングを使用します。したがって、層化サンプリングが必要な場合は、層化サンプリングを使用できません。デフォルトに依存するため、自分で設定する必要があります。
最も科学的で合理的であるために必要な観察の数にも特別な注意を払う必要があります。答えは 1,000 です。信頼区間はパーセンタイル法に従って計算されるため、この数値より小さい場合、計算結果が不正確になるため、小さすぎることはできません。 1000 を超える場合、ほとんどの場合、精度の向上は非常に限られており、システム リソースと計算時間が無駄になります。
ブートストラップのspss解析の操作手順:「解析」~「平均値の比較」~「平均値」~独立変数と従属変数の選択~「オプション」サブダイアログ~「セル統計」~ブートストラップサブダイアログボックス ~ ブートストラップを実行するチェックボックス
もう 1 点、従属変数が正規分布に一致するか、正規分布にほぼ一致する場合には、ブートストラップ法を使用する必要はありません。
以上がブートストラップ法とはどういう意味ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。