> Java > java지도 시간 > 본문

Java/ColdFusion/CFML을 사용하여 언어 감지 라이브러리(및 API) 비교

WBOY
풀어 주다: 2024-09-06 06:00:32
원래의
957명이 탐색했습니다.

Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML

언어 감지는 지난 프로젝트에서 필요했던 기능이었습니다. Optimaize Language Detector Java 라이브러리의 kju2 포크 사용에 관한 기사를 2020년에 썼습니다. Optimaize 라이브러리는 2015년 이후 업데이트되지 않았으며 kju2 포크는 2023년 4월 16일에 읽기 전용 모드로 전환되었습니다.

Lingua Java 라이브러리를 평가해봤습니다. 이는 "긴 텍스트와 짧은 텍스트 모두에 적합한 Java 및 JVM용 가장 정확한 자연어 감지 라이브러리"라고 주장하며 적극적으로 업데이트 및 지원되는 것으로 보입니다. 소규모 단위 테스트에서는 Lingua가 약간 느린 것 같았고 말레이어 텍스트를 올바르게 식별하지 못하는 것 같았습니다.

두 Java 라이브러리의 감지 시간은 영어의 경우 상당히 무작위였습니다. 때로는 295ms 안에 응답을 반환하고 다른 경우에는 48,000ms 이상을 반환합니다. (저만의 개발자 PC일지도 모르겠습니다.) kju2가 평균적으로 더 빠른 것 같았습니다.

또한 165개 언어를 지원하고 "높은 정확성"을 가지고 있다고 주장하는 타사 감지 언어 API를 찾았습니다. API 키가 필요하며 무료 및 프리미엄 요금제를 모두 제공합니다.

Java 및/또는 ColdFusion/CFML을 사용하여 언어 감지를 수행하는 경우 무엇을 사용하고 있습니까?

아랍어아랍어2아랍어19아르81عندما يريد العالم ان يتكلّم, вهو يتحدّث بلجة يونيكود. تسجّل الآن لحصور المؤتمر الدولي العاسر ليونيكود중국어중국어2중국어8zh74虽然它长得不好看, 但是它有一颗无比善良的心. 좋은 가족, 还把自己最喜欢吃的巧克力分给乐乐吃。不仅如此,谁头痛、生病了,没钱买药,它town会尽其所能进行帮助。한국어한국어12한국어3코120안녕하기 공유 할리데이비슨 대구점 MC 우제헌입니다. 포티에잇 문의 전달 및 전화로만 연결되도록 문자로 연결됩니다.스페인어스페인어0스페인어116에92Habitualmente este término se aplica a todas las pistas donde aterrizan aviones, sin embargo el término Correcto es aeródromo.태국태국1태국14번째1051개 이 말은 왓슨과 몬햄, 그리고 왓슨이 말하는 것입니다. اพ베트남어베트남어2베트남어14vi98Tất cả mọi nguời sinh ra đều đuợc tự do và bình đẳng về nhân phẩm và quyền lợi. Mọi con nguaời đều đuợc tạo hóa ban cho lý trí và lòng tâm và cần phải đối xử với nhau trong tình anh em.터키어터키어3터키어93tr212Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında insan oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Asker sevk edip dört taraftaki kavmi hep (itaati altına) almış hep muti kılmış. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş.일본어일본어3일본어7자194幸運이 놀이에 も、息子むしは이것은 4월 しがつなまり保育写ほいikuえんに入はいはりがしはまた働はたしはまた働はたしはまた働はたしはまた働はたしはまた働はたしが始はじめた。 태국태국1태국2번째78말레이어말레이어2알 수 없음291아이디88Pesan 도덕적 dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terya tamak dan serakah. Sepiap orang sudah memiliki rezekinya masing-masing. Orang yang teribu serakah akan mendapat Balasan yang setimpal dengan perbuatanya. Selalu berbuat baik lah Dalam ikiap hanpah laku, maka kita akan mendapat kebidahan dan happanika. 소스 코드
해야 한다 kju2랑 kju2ms 링구아 랭 링구아 ms 아피랭 APIMS 샘플 텍스트
영어 영어 2272 영어 570 ko 537 스페인어 어휘를 배우는 가장 좋은 방법은 완전히 해당 언어로 된 텍스트, 이야기, 기사를 읽는 것입니다. 이것이 바로 우리가 다양한 주제에 관해 스페인어로 된 짧은 읽기 구절을 작성한 이유입니다.
그리스어 그리스어 6 그리스어 12 105 Βιβλος γενέσεΩς Ἰennaσοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.
프랑스어 프랑스어 61 프랑스어 78 프랑스 70 프랑스에서는 실패할 것 같아요. Lesoleil se lève tard. Il fait encore nuit quand je vais au travail. Parfois, il y a même de la neige.
히브리어 히브리어 3 히브리어 11 이봐 110
러시아 러시아 2 러시아 1393 96 모든 사람은 태어날 때부터 자유롭고 존엄성과 권리가 평등합니다. 그들은 이성과 양심을 부여받았으며 형제애 정신으로 서로 관계하여 행동해야 합니다.
핀란드어 핀란드어 6 핀란드어 383 파이 125 누구나 교육을 받을 권리가 있습니다. 교육은 적어도 초등교육과 기초교육은 무료로 이루어져야 합니다. 초등교육은 의무교육이어야 합니다. 기술 및 직업 교육은 보편적으로 제공되어야 하며, 고등 교육은 모든 사람에게 능력에 따라 평등하게 열려야 합니다.
우르두 우르두 1 우르두 22 104 나는 당신의 이야기에 대해 이야기합니다.
안녕하세요 세계
https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25

위 내용은 Java/ColdFusion/CFML을 사용하여 언어 감지 라이브러리(및 API) 비교의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿