ブートストラップ信頼区間を見つける方法-ブートストラップのチュートリアル-php.cn

ブートストラップ信頼区間を見つける方法

尚

リリース： 2019-07-27 15:11:58

オリジナル

7963 人が閲覧しました

ブートストラップ信頼区間を見つける方法

ブートストラップ信頼区間:

全体の分布 F は不明ですが、分布 F からの容量を持つデータサンプルがあると仮定します。このサンプルは、置換抽出法により容量 n 個のサンプルを抽出したものであり、このサンプルをブートストラップサンプルと呼びます。元のサンプルから多くのブートストラップサンプルを連続的かつ独立して抽出し、これらのサンプルを使用して母集団 F に関する統計的推論を行います。この方法はノンパラメトリックブートストラップ法と呼ばれ、ブートストラップ法とも呼ばれます。

ブートストラップ法を使用すると、変数 (パラメーター) の信頼区間を取得できます。これをブートストラップ信頼区間と呼びます。

ブートストラップ信頼区間:

Python を使用してブートストラップ信頼区間を計算します:

ここに 1 次元データを示します。例、サンプリングこの平均値はサンプル推定量として機能します。コードは次のとおりです:

import numpy as np


def average(data):
    return sum(data) / len(data)


def bootstrap(data, B, c, func):
    """
    计算bootstrap置信区间
    :param data: array 保存样本数据
    :param B: 抽样次数 通常B>=1000
    :param c: 置信水平
    :param func: 样本估计量
    :return: bootstrap置信区间上下限
    """
    array = np.array(data)
    n = len(array)
    sample_result_arr = []
    for i in range(B):
        index_arr = np.random.randint(0, n, size=n)
        data_sample = array[index_arr]
        sample_result = func(data_sample)
        sample_result_arr.append(sample_result)

    a = 1 - c
    k1 = int(B * a / 2)
    k2 = int(B * (1 - a / 2))
    auc_sample_arr_sorted = sorted(sample_result_arr)
    lower = auc_sample_arr_sorted[k1]
    higher = auc_sample_arr_sorted[k2]

    return lower, higher


if __name__ == &#39;__main__&#39;:
    result = bootstrap(np.random.randint(0, 50, 50), 1000, 0.95, average)
    print(result)

ログイン後にコピー

出力: