Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?

WBOY
Lepaskan: 2024-08-06 20:16:30
asal
881 orang telah melayarinya

How to improve ML Model Accuracy for Text Classification?

Hai Pakar,

Kami sedang menangani Masalah Klasifikasi Teks. Kami mempunyai kira-kira 80K rekod dengan kira-kira 50 kelas. Data sangat tidak seimbang. Ia mempunyai 2 lajur satu untuk penerangan dan satu lagi mengandungi kelas.
Sehingga kini kami telah mencuba model dan teknik berikut:

  1. Pemprosesan Data: a. Penukaran huruf kecil, dialih keluar teks angka, dialih keluar tanda baca b. Mengalih keluar perkataan yang tidak penting dan menghentikan perkataan c. Lemmatisasi
  2. Transformasi TFIDF
  3. Menggunakan Model SKLEARN: a. SVC linear b. Regresi Linear c. Regresi Logistik d. Pokok Keputusan e. Hutan Rawak
  4. Menggunakan Huggingface Transformers: a. Google Bert b. Suling Bert
  5. persampelan SMOTE

Diperhatikan bahawa ketepatan maksimum yang kami dapat ialah 70% (Random Forest dan Google Bert).
Adakah terdapat sebarang skop untuk meningkatkan ketepatan?
Jika ya, apakah teknik atau model lain yang boleh kita gunakan untuk meningkatkan ketepatan?

Atas ialah kandungan terperinci Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!