python learning_curveFunktion
Die Funktion dieser Funktion besteht darin, die Ergebnisse von Kreuzvalidierungstraining und Tests für Trainingssätze unterschiedlicher Größe zu bestimmen.
Ein Kreuzvalidierungsgenerator teilt den gesamten Datensatz k-mal in einen Trainingssatz und einen Testsatz auf. (Empfohlenes Lernen: Python-Video-Tutorial)
Teilmengen des Trainingssatzes unterschiedlicher Größe werden zum Trainieren des Bewerters verwendet und für jede Größe des Trainingsteilsatzes wird eine Punktzahl generiert Die Testsatzergebnisse werden ebenfalls berechnet. Dann werden für jede Trainingsteilmenge alle diese Ergebnisse nach k Läufen gemittelt.
Diese Funktion muss auf das Sklearn-Paket verweisen
import sklearnfrom sklearn.learning_curve import learning_curve
Das Aufrufformat dieser Funktion ist:
learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)
Schätzer: verwendeter Klassifikator
like, shape (n_samples) oder (n_samples, n_features), optional
Zielklassifizierung oder Regression relativ zu X
train_sizes:array-like, shape (n_ticks ,), dtype float oder int
Die relative oder absolute Anzahl der Trainingsbeispiele. Diese Mengen an Beispielen erzeugen eine Lernkurve. Wenn dtype float ist, wird es als Teil des maximalen Trainingssatzes betrachtet (dies wird durch die ausgewählte Validierungsmethode bestimmt). Andernfalls wird es als absolute Größe des Trainingssatzes behandelt. Es ist zu beachten, dass für die Klassifizierung die Stichprobengröße groß genug sein muss, um mindestens eine Stichprobe für jede Klassifizierung zu enthalten.
cv:int, Kreuzvalidierungsgenerator oder ein iterierbarer, optionaler
Bestimmen Sie die Kreuzvalidierungs-Trennstrategie
--Keine, verwenden Sie die standardmäßige dreifache Kreuzvalidierung. Validierung,
--Ganzzahl, bestimmt die Anzahl der Falten der Kreuzvalidierung
--ein Objekt, das als Kreuzvalidierungsgenerator verwendet wird
--ein Objekt, das für verwendet wird Trainings-/Testtrennungs-Iterator
ausführlich: Ganzzahl, optional
Kontrollredundanz: Je höher, desto mehr Informationen sind vorhanden
Rückgabewert:
train_sizes_abs: array, shape = (n_unique_ticks,), dtype int
Die Anzahl der Proben im Trainingssatz, die zum Generieren der Lernkurve verwendet werden. Da doppelte Eingaben gelöscht werden, können Ticks kleiner als n_ticks sein.
train_scores: Array, Form (n_ticks, n_cv_folds)
Scores für den Trainingssatz
test_scores: array , Form (n_ticks, n_cv_folds)
Ergebnisse des Testsatzes
Weitere technische Artikel zum Thema Python finden Sie in der Spalte
Python-Tutorial, um mehr darüber zu erfahren!
Das obige ist der detaillierte Inhalt vonSo verwenden Sie learning_curve in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!