


Membandingkan Pustaka Pengesanan Bahasa (& API) Menggunakan Java/ColdFusion/CFML
Pengesanan bahasa ialah ciri yang kami perlukan dalam projek yang lalu. Saya menulis artikel pada tahun 2020 mengenai penggunaan kju2 fork perpustakaan java Optimaize Language Detector. Pustaka Optimaize tidak dikemas kini sejak 2015 dan garpu kju2 diletakkan dalam mod baca sahaja pada 16 Apr 2023.
Saya menilai perpustakaan Lingua java. Ia mendakwa sebagai "Pustaka pengesanan bahasa semula jadi yang paling tepat untuk Java dan JVM, sesuai untuk teks panjang dan pendek" dan juga nampaknya dikemas kini secara aktif & disokong. Dalam ujian unit kecil saya, Lingua nampaknya perlahan sedikit dan tidak dapat mengenal pasti teks bahasa Melayu dengan betul.
Masa pengesanan untuk kedua-dua perpustakaan java adalah agak rawak untuk bahasa Inggeris. Kadangkala ia akan mengembalikan respons dalam 295 ms dan pada masa lain ia akan menjadi 48,000+ ms. (Mungkin ia hanya PC pembangun saya.) kju2 nampaknya lebih pantas secara purata.
Saya juga menemui API Detect Language pihak ketiga yang menyokong 165 bahasa dan mendakwa mempunyai "ketepatan tinggi". Ia memerlukan kunci API dan menawarkan kedua-dua pelan percuma & premium.
Jika anda melakukan pengesanan bahasa dengan Java dan/atau ColdFusion/CFML, apakah yang anda gunakan?
Sepatutnya | kju2 lang | kju2 ms | lingua lang | lingua ms | api lang | api ms | Teks Contoh |
---|---|---|---|---|---|---|---|
BAHASA INGGERIS | BAHASA INGGERIS | 2272 | BAHASA INGGERIS | 570 | ms | 537 | Cara terbaik untuk mempelajari perbendaharaan kata bahasa Sepanyol ialah dengan membaca teks, cerita atau artikel yang sepenuhnya dalam bahasa itu. Itulah sebabnya kami telah menulis petikan bacaan pendek sendiri dalam bahasa Sepanyol tentang topik yang berbeza. |
GREEN | GREEN | 6 | GREEN | 12 | el | 105 | Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀ>β |
PERANCIS | 61 | PERANCIS | 78 | fr | 70 | Dalam hiver, il fait froid di Perancis. Le soleil se lève tard. Jika anda mengalami masalah ini, anda akan mengalami kesakitan. Parfois, il y a même de la neige. | |
Ibrani | 3 | Ibrani | 11 | iw | 110 | > | ARAB |
2 | ARAB | 19 | ar | 81 | عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود | CINA | |
2 | CINA | 8 | zh | 74 | 虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水再。丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃。不仅如此,谁头痛、生病了,没钱乐乐吃。不仅如此,谁头痛、生病了,没钱买药,元街药,定行帮助。 | BAHASA KOREA | |
12 | BAHASA KOREA | 3 | ko | 120 | 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다. 포티에잇 문의 전달받고 전화 드렸습니다만 연결되지 않아 문자 드립>. | BAHASA Sepanyol | |
0 | BAHASA Sepanyol | 116 | es | 92 | Kebiasaan este término se aplica todas las pistas donde aterrizan aviones, sin embargo el término correcto es aeródromo. | THAI | |
1 | THAI | 14 | ke | 105 | ข้อ 1 มนุษย์ทั้งหลายเกิดมามีอิสีอิสสอิสะอิะะอิสออิสะอิสอระ ภาคกันในเกียรติศักด[เกียรติศักด]ะสด ต่างมีเหตุผลและมโนธรรม และควรปฏุรปฏิัอ ด้วยเจตนารมณ์แห่งภราดรภาพ | VIETNAME | |
2 | VIETNAME | 14 | vi | 98 | Tất cả mọi người sinh ra đều được tự do và bình đẳng về nhân phẩm và quyền lợi. Mọi con người đều được tạo hóa ban cho lý trí và lương tâm và cần phải đối xử với nhau trong tình anh em>🎜. | TURKI | TURKI |
TURKI | 93 | tr | 212 | Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında insan oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Penanya sevk edip dört taraftaki kavmi hep (itaati altına) almış hep muti kılmış. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş. | JEPUN | JEPUN | |
JEPUN | 7 | ja | 194 | 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいこくとができ、私わたしはまた働はたらき始はじめた。 | |||
RUSSIAN | RUSSIAN | 2 | RUSSIAN | 1393 | ru | 96 | Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства. |
FINNISH | FINNISH | 6 | FINNISH | 383 | fi | 125 | Jokaisella on oikeus saada opetusta. Opetuksen on oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen on oltava pakollinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, ja korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan. |
URDU | URDU | 1 | URDU | 22 | ur | 104 | ایک ملک پر سخت گیر بادشاہ حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹیکس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔ |
THAI | THAI | 1 | THAI | 2 | th | 78 | Hello World สวัสดีชาวโลก |
MALAY | MALAY | 2 | UNKNOWN | 291 | id | 88 | Pesan moral dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terlalu tamak dan serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal dengan perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan. |
Source Code
https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25
Atas ialah kandungan terperinci Membandingkan Pustaka Pengesanan Bahasa (& API) Menggunakan Java/ColdFusion/CFML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Enums di Java adalah kelas khas yang mewakili bilangan tetap nilai tetap. 1. Gunakan definisi kata kunci enum; 2. Setiap nilai enum adalah contoh akhir statik awam jenis enum; 3. Ia boleh termasuk bidang, pembina dan kaedah untuk menambah tingkah laku kepada setiap pemalar; 4. Ia boleh digunakan dalam pernyataan suis, menyokong perbandingan langsung, dan menyediakan kaedah terbina dalam seperti nama (), ordinal (), nilai () dan nilai (); 5. Penghitungan boleh meningkatkan jenis keselamatan, kebolehbacaan dan fleksibiliti kod, dan sesuai untuk senario pengumpulan terhad seperti kod status, warna atau minggu.

Java menyokong pengaturcaraan asynchronous termasuk penggunaan aliran yang boleh diselesaikan, aliran responsif (seperti ProjectReactor), dan benang maya di Java19. 1.CompletableFuture meningkatkan kebolehbacaan dan penyelenggaraan kod melalui panggilan rantai, dan menyokong orkestrasi tugas dan pengendalian pengecualian; 2. ProjectReactor menyediakan jenis mono dan fluks untuk melaksanakan pengaturcaraan responsif, dengan mekanisme tekanan belakang dan pengendali yang kaya; 3. Thread maya mengurangkan kos konvensional, sesuai untuk tugas I/O-intensif, dan lebih ringan dan lebih mudah untuk berkembang daripada benang platform tradisional. Setiap kaedah mempunyai senario yang berkenaan, dan alat yang sesuai harus dipilih mengikut keperluan anda dan model campuran harus dielakkan untuk mengekalkan kesederhanaan

Prinsip pengasingan antara muka (ISP) menghendaki pelanggan tidak bergantung pada antara muka yang tidak digunakan. Inti adalah untuk menggantikan antara muka yang besar dan lengkap dengan pelbagai antara muka kecil dan halus. Pelanggaran prinsip ini termasuk: Pengecualian yang tidak diletakkan dilemparkan apabila kelas melaksanakan antara muka, sebilangan besar kaedah tidak sah dilaksanakan, dan fungsi yang tidak relevan secara paksa diklasifikasikan ke antara muka yang sama. Kaedah permohonan termasuk: membahagikan antara muka mengikut kaedah biasa, menggunakan antara muka berpecah mengikut pelanggan, dan menggunakan kombinasi dan bukannya pelaksanaan pelbagai antara muka jika perlu. Sebagai contoh, perpecahan antara muka mesin yang mengandungi kaedah percetakan, pengimbasan, dan faks ke dalam pencetak, pengimbas, dan faxmachine. Peraturan boleh dilonggarkan dengan sewajarnya apabila menggunakan semua kaedah pada projek kecil atau semua pelanggan.

Terdapat tiga perbezaan utama antara yang boleh dipanggil dan boleh dijalankan di Jawa. Pertama, kaedah yang boleh dipanggil boleh mengembalikan hasilnya, sesuai untuk tugas -tugas yang perlu mengembalikan nilai, seperti yang boleh dipanggil; Walaupun kaedah run () runnable tidak mempunyai nilai pulangan, sesuai untuk tugas -tugas yang tidak perlu kembali, seperti pembalakan. Kedua, Callable membolehkan untuk membuang pengecualian yang diperiksa untuk memudahkan penghantaran ralat; Walaupun Runnable mesti mengendalikan pengecualian secara dalaman. Ketiga, Runnable boleh dihantar secara langsung ke benang atau executorservice, sementara yang boleh dipanggil hanya boleh dikemukakan ke executorservice dan mengembalikan objek masa depan untuk

Di Java, enums sesuai untuk mewakili set tetap tetap. Amalan terbaik termasuk: 1. Gunakan enum untuk mewakili keadaan tetap atau pilihan untuk meningkatkan keselamatan jenis dan kebolehbacaan; 2. Tambah sifat dan kaedah untuk meningkatkan fleksibiliti, seperti menentukan bidang, pembina, kaedah penolong, dan lain -lain; 3. Gunakan enummap dan enumset untuk meningkatkan prestasi dan jenis keselamatan kerana mereka lebih cekap berdasarkan tatasusunan; 4. Elakkan penyalahgunaan enum, seperti nilai dinamik, perubahan kerap atau senario logik kompleks, yang harus digantikan dengan kaedah lain. Penggunaan enum yang betul boleh meningkatkan kualiti kod dan mengurangkan kesilapan, tetapi anda perlu memberi perhatian kepada sempadannya yang berkenaan.

Javanio adalah IOAPI baru yang diperkenalkan oleh Java 1.4. 1) bertujuan untuk penampan dan saluran, 2) mengandungi komponen teras penampan, saluran dan pemilih, 3) menyokong mod tidak menyekat, dan 4) mengendalikan sambungan serentak lebih cekap daripada IO tradisional. Kelebihannya dicerminkan dalam: 1) IO yang tidak menyekat mengurangkan overhead thread, 2) Buffer meningkatkan kecekapan penghantaran data, 3) pemilih menyedari multiplexing, dan 4) memori pemetaan memori sehingga membaca dan menulis fail. Nota Apabila menggunakan: 1) Operasi flip/jelas penampan mudah dikelirukan, 2) Data yang tidak lengkap perlu diproses secara manual tanpa menyekat, 3) Pendaftaran pemilih mesti dibatalkan dalam masa, 4) NIO tidak sesuai untuk semua senario.

Mekanisme pemuatan kelas Java dilaksanakan melalui kelas, dan aliran kerja terasnya dibahagikan kepada tiga peringkat: memuatkan, menghubungkan dan memulakan. Semasa fasa pemuatan, kelas muat turun secara dinamik membaca bytecode kelas dan mencipta objek kelas; Pautan termasuk mengesahkan ketepatan kelas, memperuntukkan memori kepada pembolehubah statik, dan rujukan simbol parsing; Inisialisasi melakukan blok kod statik dan tugasan pembolehubah statik. Pemuatan kelas mengamalkan model delegasi induk, dan mengutamakan loader kelas induk untuk mencari kelas, dan cuba bootstrap, lanjutan, dan appliclassloader pada gilirannya untuk memastikan perpustakaan kelas teras selamat dan mengelakkan pemuatan pendua. Pemaju boleh menyesuaikan kelas, seperti UrlClassl

JavaprovidesmultiplesynchronizationToolsforthreadsafety.1.SynchronizedBlockSensensureMutualExclusionByLockingMethodsorspecificcodesections.2.reentrantlockoffersadvancedControl, termasuktrylockandfairnesspolicies.condition
