Analisis mendalam analisis diskriminasi linear LDA-AI-php.cn

Analisis mendalam analisis diskriminasi linear LDA

WBOY

Lepaskan： 2024-01-23 20:57:05

ke hadapan

524 orang telah melayarinya

Analisis mendalam analisis diskriminasi linear LDA

Analisis Diskriminasi Linear (LDA) ialah kaedah pengelasan corak klasik yang boleh digunakan untuk pengurangan dimensi dan pengekstrakan ciri. Dalam pengecaman muka, LDA sering digunakan untuk pengekstrakan ciri. Idea utama adalah untuk menayangkan data ke dalam subruang dimensi rendah untuk mencapai perbezaan maksimum bagi kategori data yang berbeza dalam subruang dan varians minimum kategori data yang sama dalam subruang. Dengan mengira vektor eigen bagi matriks serakan antara kelas dan matriks serakan intra-kelas, arah unjuran yang optimum boleh diperolehi, dengan itu mencapai pengurangan dimensi dan pengekstrakan ciri data. LDA mempunyai prestasi pengelasan yang baik dan kecekapan pengiraan dalam aplikasi praktikal, dan digunakan secara meluas dalam pengecaman imej, pengecaman corak dan bidang lain.

Idea asas analisis diskriminasi linear (LDA) adalah untuk menayangkan data dimensi tinggi ke dalam ruang dimensi rendah supaya pengagihan kategori data yang berbeza dalam ruang ini dapat memaksimumkan perbezaan. Ia meningkatkan ketepatan pengelasan dengan menayangkan data asal ke dalam ruang baharu supaya data kategori yang sama sedekat mungkin dan data kategori berbeza berada sejauh mungkin. Secara khusus, LDA menentukan arah unjuran dengan mengira nisbah antara matriks perbezaan antara kelas dan matriks perbezaan antara kelas, supaya data yang diunjurkan memenuhi matlamat ini sebanyak mungkin. Dengan cara ini, dalam ruang dimensi rendah yang diunjurkan, data kategori yang sama akan dikumpulkan bersama dengan lebih rapat, dan data antara kategori yang berbeza akan lebih tersebar, menjadikan pengelasan lebih mudah.

Prinsip asas analisis diskriminasi linear LDA

Analisis diskriminasi linear (LDA) ialah algoritma pembelajaran seliaan biasa, digunakan terutamanya untuk pengurangan dan pengelasan dimensi. Prinsip asas adalah seperti berikut:

Andaikan kita mempunyai set set data berlabel, dan setiap sampel mempunyai berbilang vektor ciri. Matlamat kami adalah untuk mengklasifikasikan titik data ini ke dalam label yang berbeza. Untuk mencapai matlamat ini, kami boleh melakukan langkah-langkah berikut: 1. Kirakan vektor min bagi semua vektor ciri sampel di bawah setiap label untuk mendapatkan vektor min bagi setiap label. 2. Kira jumlah min vektor semua titik data, iaitu min semua vektor ciri sampel dalam keseluruhan set data. 3. Kira matriks perbezaan antara kelas bagi setiap label. Matriks perbezaan antara kelas ialah hasil daripada perbezaan antara vektor ciri semua sampel dalam setiap label dan vektor min untuk label itu, dan kemudian keputusan untuk setiap label dijumlahkan. 4. Kira hasil darab matriks songsang bagi matriks perbezaan dalam kelas dan matriks perbezaan antara kelas untuk mendapatkan vektor unjuran. 5. Normalkan vektor unjuran untuk memastikan panjangnya ialah 1. 6. Unjurkan titik data pada vektor unjuran untuk mendapatkan vektor ciri satu dimensi. 7. Gunakan ambang yang ditetapkan untuk mengklasifikasikan vektor ciri satu dimensi ke dalam label yang berbeza. Melalui langkah di atas, kami boleh menayangkan titik data berbilang dimensi ke dalam ruang ciri satu dimensi dan mengelaskannya ke dalam label yang sepadan berdasarkan ambang. Kaedah ini boleh membantu kami mencapai pengurangan dimensi dan klasifikasi data.

Idea teras LDA adalah untuk mengira vektor min dan matriks perbezaan untuk menemui struktur dalaman dan hubungan kategori data. Data dikurangkan secara dimensi dengan menayangkan vektor, dan pengelas digunakan untuk tugas pengelasan.

Analisis diskriminasi linear Proses pengiraan LDA

Proses pengiraan LDA boleh diringkaskan sebagai langkah berikut:

Kira vektor min bagi setiap kategori, iaitu purata vektor ciri semua sampel dalam setiap kategori, dan hitung jumlah vektor min.

Apabila mengira matriks perbezaan antara kelas, perbezaan antara vektor ciri dan vektor min sampel dalam setiap kategori perlu didarab dan dikumpul.

Kira matriks serakan antara kelas dengan mendarabkan perbezaan antara jumlah vektor min dalam setiap kategori dan vektor min bagi setiap kategori, dan kemudian kumpulkan keputusan semua kategori.

4 Kirakan vektor unjuran, iaitu, unjurkan vektor ciri kepada vektor pada ruang satu dimensi Vektor ini ialah hasil darab matriks songsang bagi matriks perbezaan antara kelas. dan kemudian normalkan vektor.

5. Unjurkan semua sampel untuk mendapatkan vektor ciri satu dimensi.

6. Kelaskan sampel mengikut vektor ciri satu dimensi.

7. Nilaikan prestasi pengelasan.

Analisis diskriminasi linear kelebihan dan kekurangan kaedah LDA

Analisis diskriminasi linear LDA ialah algoritma pembelajaran seliaan yang biasa Kelebihan dan kekurangannya adalah seperti berikut:

Kelebihan:

LDA bukan sahaja boleh digunakan untuk pengelasan, tetapi juga untuk pengurangan dimensi, yang boleh meningkatkan prestasi pengelas dan mengurangkan jumlah pengiraan.
LDA menganggap bahawa data memenuhi taburan normal dan mempunyai tahap keteguhan tertentu kepada hingar Untuk data yang kurang hingar, LDA mempunyai kesan pengelasan yang sangat baik.
LDA mengambil kira struktur dalaman data dan hubungan antara kategori, mengekalkan maklumat diskriminasi data sebanyak mungkin dan mempertingkatkan ketepatan pengelasan.

Kelemahan:

LDA menganggap bahawa matriks kovarians setiap kategori adalah sama, tetapi dalam aplikasi praktikal, sukar untuk memenuhi andaian ini dan boleh menjejaskan kesan pengelasan.
LDA mempunyai hasil pengelasan yang lemah untuk data tidak boleh dipisahkan secara linear.
LDA sensitif kepada outlier dan hingar, yang mungkin menjejaskan kesan pengelasan.
LDA perlu mengira matriks songsang matriks kovarian Jika dimensi ciri terlalu tinggi, ia mungkin menyebabkan jumlah pengiraan yang sangat besar dan tidak sesuai untuk memproses data berdimensi tinggi.

Ringkasnya, analisis diskriminasi linear LDA sesuai untuk memproses dimensi rendah, boleh dipisahkan secara linear dan data yang memenuhi taburan normal Walau bagaimanapun, untuk dimensi tinggi, tidak boleh dipisahkan linear atau data yang tidak memenuhi taburan normal, ia adalah perlu untuk Pilih algoritma lain.

Atas ialah kandungan terperinci Analisis mendalam analisis diskriminasi linear LDA. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!