python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集
天蓬老师
天蓬老师 2017-04-18 09:03:54
0
3
1034

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

répondre à tous(3)
黄舟

Divisez-le en 10 parties égales et effectuez 10 cycles. À chaque fois, sélectionnez 1 partie comme ensemble de test et 9 parties comme ensemble d'entraînement

洪涛

De manière générale, lors d'une validation croisée, tout le monde définira k sur 5 ou 10. C'est-à-dire que les données sont (aléatoirement) divisées en k parties, dont les parties k-1 sont utilisées pour la formation et la partie 1 sont utilisés pour les tests. Mais ceci dit, vous devez faire une validation croisée, donc cela ne devrait pas être rapide.

Ty80

可以用3.1. Validation croisée : évaluer les performances de l'estimateur

>>> à partir de sklearn.model_selection importer cross_val_score >>> clf = svm.SVC(noyau='linéaire', C=1) >>> scores = cross_val_score(clf, iris.data, iris.target, cv=5) >>> partitions array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal