Rumah > pangkalan data > tutorial mysql > Bagaimanakah saya boleh Mengira Peratusan Kesamaan Rentetan dalam MySQL menggunakan Jarak Levenshtein?

Bagaimanakah saya boleh Mengira Peratusan Kesamaan Rentetan dalam MySQL menggunakan Jarak Levenshtein?

Patricia Arquette
Lepaskan: 2024-12-13 05:48:12
asal
564 orang telah melayarinya

How can I Calculate String Similarity Percentage in MySQL using Levenshtein Distance?

Persamaan Rentetan Pengkomputeran dalam MySQL

Dalam sistem pengurusan pangkalan data seperti MySQL, membandingkan persamaan rentetan teks adalah keperluan biasa. Artikel ini meneroka pendekatan serba boleh untuk mengira peratusan persamaan antara dua rentetan menggunakan fungsi MySQL.

Mengira Kesamaan Rentetan Menggunakan Jarak Levenshtein

Jarak Levenshtein ialah metrik yang mengukur bilangan suntingan (sisipan , pemadaman atau penggantian) diperlukan untuk mengubah satu rentetan kepada rentetan yang lain. Skor persamaan yang lebih tinggi menunjukkan persamaan yang lebih rapat antara rentetan.

Dalam MySQL, fungsi LEVENSHTEIN() mengira jarak Levenshtein antara dua rentetan. Untuk mendapatkan peratusan persamaan, kita boleh menggunakan formula berikut:

Similarity Percentage = (1 - (Levenshtein Distance / Length of Longest String)) * 100
Salin selepas log masuk

Pelaksanaan MySQL

Untuk melaksanakan pendekatan ini dalam MySQL, cipta dua fungsi berikut:

LEVENSHTEIN() Fungsi:

CREATE FUNCTION `LEVENSHTEIN`(s1 TEXT, s2 TEXT) RETURNS INT(11)
DETERMINISTIC
BEGIN
    # ... Function implementation ...
END;
Salin selepas log masuk

LEVENSHTEIN_RATIO() Fungsi:

CREATE FUNCTION `LEVENSHTEIN_RATIO`(s1 TEXT, s2 TEXT) RETURNS INT(11)
DETERMINISTIC
BEGIN
    # ... Function implementation ...
END;
Salin selepas log masuk

Contoh Penggunaan

Memandangkan contoh yang diberikan dalam soalan:

SET @a = "Welcome to Stack Overflow";
SET @b = "Hello to stack overflow";
Salin selepas log masuk

Pertanyaan untuk mengira peratusan persamaan antara @a dan @b ialah:

SELECT LEVENSHTEIN_RATIO(@a, @b) AS SimilarityPercentage;
Salin selepas log masuk

Pertanyaan ini akan mengembalikan nilai 60, menunjukkan persamaan 60% antara dua rentetan.

Atas ialah kandungan terperinci Bagaimanakah saya boleh Mengira Peratusan Kesamaan Rentetan dalam MySQL menggunakan Jarak Levenshtein?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan