ブートストラップ信頼区間:
全体の分布 F は不明ですが、分布 F からの容量を持つデータ サンプルがあると仮定します。このサンプルは、置換抽出法により容量 n 個のサンプルを抽出したものであり、このサンプルをブートストラップサンプルと呼びます。元のサンプルから多くのブートストラップ サンプルを連続的かつ独立して抽出し、これらのサンプルを使用して母集団 F に関する統計的推論を行います。この方法はノンパラメトリック ブートストラップ法と呼ばれ、ブートストラップ法とも呼ばれます。
ブートストラップ法を使用すると、変数 (パラメーター) の信頼区間を取得できます。これをブートストラップ信頼区間と呼びます。
ブートストラップ信頼区間:
Python を使用してブートストラップ信頼区間を計算します:
ここに 1 次元データを示します。例、サンプリング この平均値はサンプル推定量として機能します。コードは次のとおりです:
import numpy as np def average(data): return sum(data) / len(data) def bootstrap(data, B, c, func): """ 计算bootstrap置信区间 :param data: array 保存样本数据 :param B: 抽样次数 通常B>=1000 :param c: 置信水平 :param func: 样本估计量 :return: bootstrap置信区间上下限 """ array = np.array(data) n = len(array) sample_result_arr = [] for i in range(B): index_arr = np.random.randint(0, n, size=n) data_sample = array[index_arr] sample_result = func(data_sample) sample_result_arr.append(sample_result) a = 1 - c k1 = int(B * a / 2) k2 = int(B * (1 - a / 2)) auc_sample_arr_sorted = sorted(sample_result_arr) lower = auc_sample_arr_sorted[k1] higher = auc_sample_arr_sorted[k2] return lower, higher if __name__ == '__main__': result = bootstrap(np.random.randint(0, 50, 50), 1000, 0.95, average) print(result)
出力:
(20.48, 28.32)
以上がブートストラップ信頼区間を見つける方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。