Pengenalan
Perbandingan kesamaan dalam rentetan ialah tugas biasa dalam pemprosesan dan data bahasa semula jadi analisis. Dalam Java, beberapa kaedah boleh digunakan untuk menentukan persamaan antara dua rentetan.
Mengira Kesamaan
Formula berikut biasanya digunakan untuk mengira persamaan antara dua rentetan dalam julat dari 0% hingga 100%. Ia mengukur peratusan perubahan yang diperlukan untuk mengubah rentetan yang lebih besar kepada yang lebih kecil:
similarity = (longerLength - editDistance) / longerLength * 100
Jarak Levenshtein
Jarak edit, komponen penting dalam persamaan pengiraan, mengukur bilangan minimum sisipan, pemadaman atau penggantian yang diperlukan untuk mengubah satu rentetan kepada rentetan yang lain. Satu algoritma popular untuk mengira jarak edit ialah jarak Levenshtein.
Contoh Pelaksanaan
Berikut ialah contoh yang mengira persamaan antara dua rentetan menggunakan jarak Levenshtein:
public static double similarity(String s1, String s2) { int longerLength = Math.max(s1.length(), s2.length()); int editDistance = editDistance(s1, s2); return (longerLength - editDistance) / (double) longerLength; } private static int editDistance(String s1, String s2) { // ... implementation }
Lain-lain Kaedah
Selain jarak Levenshtein, kaedah alternatif untuk mengira persamaan rentetan termasuk:
Aplikasi
Perbandingan persamaan rentetan mempunyai banyak aplikasi, termasuk:
Kesimpulan
Mengira persamaan rentetan ialah teknik yang berharga untuk banyak pemprosesan bahasa semula jadi dan tugasan analisis data. Dengan memanfaatkan kaedah seperti jarak Levenshtein, pembangun boleh menentukan persamaan antara rentetan dengan pelbagai darjah ketepatan.
Atas ialah kandungan terperinci Bagaimanakah anda mengukur persamaan rentetan dalam Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!