bagaimana cara saya memilih antara model yang berbeza?
Proses menilai pembelajaran mesin membantu menentukan sejauh mana model itu boleh dipercayai dan berkesan untuk aplikasinya. Ini melibatkan penilaian faktor yang berbeza seperti prestasi, metrik dan ketepatannya untuk ramalan atau membuat keputusan.
Tidak kira model apa yang anda pilih untuk digunakan, anda memerlukan cara untuk memilih antara model: jenis model yang berbeza, parameter penalaan dan ciri. Anda juga memerlukan prosedur penilaian model untuk menganggarkan sejauh mana model akan digeneralisasikan kepada data yang tidak kelihatan. Akhir sekali, anda memerlukan prosedur penilaian untuk dipasangkan dengan prosedur anda di lain-lain untuk mengukur prestasi model anda.
Sebelum kita meneruskan, mari kita semak beberapa prosedur penilaian model yang berbeza dan cara ia beroperasi.
Daripada di atas, kita boleh simpulkan bahawa:
Latihan dan ujian ke atas data yang sama ialah punca klasik untuk memasang lampau di mana anda membina model yang terlalu kompleks yang tidak akan digeneralisasikan kepada data baharu dan itu sebenarnya tidak berguna.
Train_Test_Split memberikan anggaran prestasi luar sampel yang jauh lebih baik.
Pengesahan silang K kali ganda lebih baik dengan pembahagian ujian kereta api K secara sistematik dan purata keputusan bersama-sama.
Ringkasnya, train_tests_split masih menguntungkan untuk pengesahan silang kerana kelajuan dan kesederhanaannya, dan itulah yang akan kami gunakan dalam panduan tutorial ini.
Anda akan sentiasa memerlukan metrik penilaian untuk mengikut prosedur pilihan anda, dan pilihan metrik anda bergantung pada masalah yang anda tangani. Untuk masalah pengelasan, anda boleh menggunakan ketepatan pengelasan. Tetapi kami akan menumpukan pada metrik penilaian klasifikasi penting lain dalam panduan ini.
Sebelum kita mempelajari sebarang metrik penilaian baharu' Mari semak ketepatan klasifikasi dan bercakap tentang kekuatan dan kelemahannya.
Kami telah memilih set data Pima Indians Diabetes untuk tutorial ini, yang merangkumi data kesihatan dan status diabetes bagi 768 pesakit.
Jom baca data dan cetak 5 baris pertama data. Lajur label menunjukkan 1 jika pesakit menghidap diabetes dan 0 jika pesakit tidak menghidap diabetes, dan kami berhasrat untuk menjawab soalan:
Soalan: Bolehkah kita meramalkan status diabetes pesakit berdasarkan ukuran kesihatan mereka?
Kami mentakrifkan metrik ciri kami X dan vektor tindak balas Y. Kami menggunakan train_test_split untuk memisahkan X dan Y kepada set latihan dan ujian.
Seterusnya, kami melatih model regresi logistik pada set latihan. Semasa langkah muat, objek model logreg sedang mempelajari hubungan antara X_train dan Y_train. Akhirnya kami membuat ramalan kelas untuk set ujian.
Kini, kami telah membuat ramalan untuk set ujian, kami boleh mengira ketepatan pengelasan, iaitu peratusan ramalan yang betul.
Walau bagaimanapun, pada bila-bila masa anda menggunakan ketepatan klasifikasi sebagai metrik penilaian anda, adalah penting untuk membandingkannya dengan Ketepatan nol, iaitu ketepatan yang boleh dicapai dengan sentiasa meramalkan kelas yang paling kerap.
Ketepatan nol menjawab soalan; jika model saya meramalkan kelas utama 100 peratus masa, berapa kerapkah ia betul? Dalam senario di atas, 32% daripada ujian_y ialah 1 (satu). Dalam erti kata lain, model bodoh yang meramalkan bahawa pesakit menghidap diabetes, adalah tepat 68% pada masa itu (iaitu sifar). Ini menyediakan garis dasar yang kami mungkin mahu mengukur regresi logistik kami model.
Apabila kami membandingkan ketepatan Null 68% dan ketepatan model 69%, model kami tidak kelihatan sangat baik. Ini menunjukkan satu kelemahan ketepatan pengelasan sebagai metrik penilaian model. Ketepatan klasifikasi tidak memberitahu kami apa-apa tentang pengedaran asas ujian ujian.
Ringkasan:
Sekarang mari kita lihat matriks kekeliruan.
Matriks Kekeliruan ialah jadual yang menerangkan prestasi model pengelasan.
Ia berguna untuk membantu anda memahami prestasi pengelas anda, tetapi ia bukan metrik penilaian model; jadi anda tidak boleh memberitahu scikit belajar memilih model dengan matriks kekeliruan terbaik. Walau bagaimanapun, terdapat banyak metrik yang boleh dikira daripada matriks kekeliruan dan ia boleh digunakan terus untuk memilih antara model.
Mari kita terangkan beberapa istilah asasnya.
Mari lihat cara kita boleh mengira metrik
Kesimpulannya:
Atas ialah kandungan terperinci Menilai Model Klasifikasi Pembelajaran Mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!