La méthode Bootstrap est une méthode d'estimation statistique très utile. Bradley Efron, professeur au Département de statistique de Stanford, a proposé une nouvelle méthode basée sur la synthèse et la synthèse des résultats de recherches antérieures. -méthodes statistiques paramétriques.
Bootstrap est un type de méthode de Monte Carlo non paramétrique. Son essence est de rééchantillonner les informations d'observation, puis de faire des inférences statistiques sur les caractéristiques de distribution de la population.
Étant donné que cette méthode utilise pleinement les informations d'observation données, elle ne nécessite pas d'autres hypothèses du modèle ni l'ajout de nouvelles observations, et elle est robuste et efficace. Depuis les années 1980, avec l’introduction de l’informatique dans la pratique statistique, cette méthode est devenue de plus en plus populaire et largement utilisée dans le domaine de l’apprentissage automatique.
Tout d'abord, Bootstrap peut éviter le problème de réduction d'échantillon causé par la validation croisée grâce au rééchantillonnage. Deuxièmement, Bootstrap peut également être utilisé pour créer un caractère aléatoire dans les données. Par exemple, la première étape de l'algorithme de forêt aléatoire bien connu consiste à sélectionner au hasard k nouveaux ensembles d'échantillons bootstrap avec remplacement à l'aide de la méthode bootstrap à partir de l'ensemble de données de formation d'origine, et ainsi à construire k arbres de régression de classification.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!