python - 在推荐系统、机器学习中，如何将一个完整的数据集划分为训练集和测试集

Question

如题，有没有快速一点的方法，我如果要做多折交叉验证，应该怎么去划分数据集

黄舟 · Answer

Divisez-le en 10 parties égales et effectuez 10 cycles. À chaque fois, sélectionnez 1 partie comme ensemble de test et 9 parties comme ensemble d'entraînement

PHP中文网 · Answer

De manière générale, lors d'une validation croisée, tout le monde définira k sur 5 ou 10. C'est-à-dire que les données sont (aléatoirement) divisées en k parties, dont les parties k-1 sont utilisées pour la formation et la partie 1 sont utilisés pour les tests. Mais ceci dit, vous devez faire une validation croisée, donc cela ne devrait pas être rapide.

PHP中文网 · Answer

可以用3.1. Validation croisée : évaluer les performances de l'estimateur

>>> à partir de sklearn.model_selection importer cross_val_score
>>> clf = svm.SVC(noyau='linéaire', C=1)
>>> scores = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> partitions                                              
array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])