So verwenden Sie learning_curve in Python-Python-Tutorial-php.cn

So verwenden Sie learning_curve in Python

(*-*)浩

Freigeben： 2019-07-09 10:24:53

Original

3327 Leute haben es durchsucht

python learning_curveFunktion

Die Funktion dieser Funktion besteht darin, die Ergebnisse von Kreuzvalidierungstraining und Tests für Trainingssätze unterschiedlicher Größe zu bestimmen.

So verwenden Sie learning_curve in Python

Ein Kreuzvalidierungsgenerator teilt den gesamten Datensatz k-mal in einen Trainingssatz und einen Testsatz auf. (Empfohlenes Lernen: Python-Video-Tutorial)

Teilmengen des Trainingssatzes unterschiedlicher Größe werden zum Trainieren des Bewerters verwendet und für jede Größe des Trainingsteilsatzes wird eine Punktzahl generiert Die Testsatzergebnisse werden ebenfalls berechnet. Dann werden für jede Trainingsteilmenge alle diese Ergebnisse nach k Läufen gemittelt.

Diese Funktion muss auf das Sklearn-Paket verweisen

import sklearnfrom sklearn.learning_curve import learning_curve

Nach dem Login kopieren

Das Aufrufformat dieser Funktion ist:

learning_curve(estimator, X, y, train_sizes=array([ 0.1  ,  0.325,  0.55 ,  0.775,  1.   ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

Nach dem Login kopieren

Schätzer: verwendeter Klassifikator

like, shape (n_samples) oder (n_samples, n_features), optional

Zielklassifizierung oder Regression relativ zu X

train_sizes:array-like, shape (n_ticks ,), dtype float oder int

Die relative oder absolute Anzahl der Trainingsbeispiele. Diese Mengen an Beispielen erzeugen eine Lernkurve. Wenn dtype float ist, wird es als Teil des maximalen Trainingssatzes betrachtet (dies wird durch die ausgewählte Validierungsmethode bestimmt). Andernfalls wird es als absolute Größe des Trainingssatzes behandelt. Es ist zu beachten, dass für die Klassifizierung die Stichprobengröße groß genug sein muss, um mindestens eine Stichprobe für jede Klassifizierung zu enthalten.

cv:int, Kreuzvalidierungsgenerator oder ein iterierbarer, optionaler

Bestimmen Sie die Kreuzvalidierungs-Trennstrategie

--Keine, verwenden Sie die standardmäßige dreifache Kreuzvalidierung. Validierung,

--Ganzzahl, bestimmt die Anzahl der Falten der Kreuzvalidierung

--ein Objekt, das als Kreuzvalidierungsgenerator verwendet wird

--ein Objekt, das für verwendet wird Trainings-/Testtrennungs-Iterator

ausführlich: Ganzzahl, optional

Kontrollredundanz: Je höher, desto mehr Informationen sind vorhanden

Rückgabewert:

train_sizes_abs: array, shape = (n_unique_ticks,), dtype int

Die Anzahl der Proben im Trainingssatz, die zum Generieren der Lernkurve verwendet werden. Da doppelte Eingaben gelöscht werden, können Ticks kleiner als n_ticks sein.

train_scores: Array, Form (n_ticks, n_cv_folds)

Scores für den Trainingssatz

test_scores: array , Form (n_ticks, n_cv_folds)

Ergebnisse des Testsatzes

Weitere technische Artikel zum Thema Python finden Sie in der Spalte

Python-Tutorial

, um mehr darüber zu erfahren!

Das obige ist der detaillierte Inhalt vonSo verwenden Sie learning_curve in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!