python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集
天蓬老师
天蓬老师 2017-04-18 09:03:54
0
3
1036

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

membalas semua(3)
黄舟

Bahagikan ia kepada 10 bahagian yang sama dan kitar 10 kali Setiap kali, pilih 1 bahagian sebagai set ujian dan 9 bahagian sebagai set latihan

洪涛

Secara umumnya, apabila melakukan pengesahan silang, semua orang akan menetapkan k kepada 5 atau 10. Maksudnya, data (secara rawak) dibahagikan kepada bahagian k, yang mana bahagian k-1 digunakan untuk latihan dan bahagian 1 digunakan untuk ujian. Tetapi setelah berkata demikian, anda perlu melakukan pengesahan silang, jadi ia tidak sepatutnya pantas.

Ty80

可以用3.1. Pengesahan silang: menilai prestasi penganggar

>>> daripada sklearn.model_selection import cross_val_score
>>> clf = svm.SVC(kernel='linear', C=1)
>>> markah = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> markah                                              
tatasusunan([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan