음성 참고 : Linux의 오프라인, 개인 정보 중심의 음성-텍스트, 텍스트 음성 연설 및 번역 도구
음성 노트는 오프라인 Speech-to-Text (TTS) 및 Machine Translation (MT) 기능을 제공하여 사용자 개인 정보를 우선시하는 오픈 소스 응용 프로그램입니다. 이를 통해 데이터를 인터넷으로 보내지 않고 여러 언어에서 메모를 작성, 검토 및 번역 할 수 있습니다.
주요 특징 :
오프라인 기능 완료 :
모든 처리는 장치에서 로컬로 발생하여 개인 정보 보호를 보호합니다.
다국어 지원 :
는 STT, TTS 및 MT를위한 광범위한 언어를 지원하며 지속적인 추가 기능이 있습니다.
다중 엔진 옵션 : 각 기능에 대한 다양한 처리 엔진에 유연성을 제공합니다 (아래 참조).
사용자 정의 모델 지원 : - 고급 사용자는 지원되는 엔진과 호환되는 사용자 정의 모델을 통합 할 수 있습니다.
무료 및 오픈 소스 : Mozilla Public License 버전 2.0에서 사용할 수 있습니다.
플랫폼 : 현재 Linux 및 Sailfish OS에서 사용할 수 있습니다
지원 엔진 :
-
stt (speech-to-text) : Coqui stt, vosk, whisper.cpp, 더 빠른 속삭임, 4 월 -asr
tts (Text-to-speech) : espeak-ng, mbrola, piper, rhvoice, coqui tts, mimic 3, whisperspeech
mt (기계 번역) : Bergamot Translator
Linux 설치 :
음성 노트는 Flatub 및 Arch 사용자 저장소 (AUR)를 통해 쉽게 사용할 수 있습니다.
- flathub (대부분의 Linux 분포의 경우) :
flatpak이 설치되었는지 확인하십시오. 그런 다음이 명령을 사용하십시오
이 패키지 옵션을 고려하십시오 :
기본 패키지 (net.mkiol.speechnote) :
전체 기능이지만 실질적인 디스크 공간이 필요합니다.
추가 패키지 : amd (net.mkiol.speechnote.addon.amd) 및 nvidia (nvidia (net.mkiol.speechnote.nvidia)에 대한 AMD에 대한 GPU 가속도.
작은 패키지 : 공간이 제한된 사용자를위한 작은 기본 기능.
-
아치 리눅스/Aur (아치 리눅스, Endeavouros, Manjaro Linux) :
Paru 또는 Yay와 같은 Aur 도우미를 사용하십시오
사용 :
런치 : - run 또는 응용 프로그램 메뉴에서 시작하십시오
언어 선택 : 초기 출시는 언어 선택을 안내합니다. "언어"탭의 뒷부분에서 이것을 조정할 수 있습니다
모델 다운로드 :
flatpak run net.mkiol.SpeechNote
STT, TTS 및 MT에 필요한 모델 파일 다운로드. 각 모델에 대한 자세한 내용은 정보 버튼을 클릭하십시오
텍스트 음성 : 텍스트를 입력하고 "읽기"를 클릭하십시오
speech-to-text : "듣기"를 클릭하고 마이크에 말하십시오
번역 : - "번역기"섹션을 사용하여 텍스트를 입력하고 소스 및 대상 언어를 선택하십시오. 실시간 번역을 위해 "입력 할 때 번역"을 활성화하십시오
-
내 경험 :
특정 영어 모델을 갖춘 데비안 12 시스템 (32GB RAM, Intel Core i3 11 세대, GPU 없음)에서 테스트는 성공적인 TTS와 번역을 산출했지만 STT 성능은 잠재적으로 모델 선택으로 인해 일치하지 않았습니다. 추가 테스트가 계획되어 있습니다.
결론 : -
Speech Note는 개인 정보 보호에 중점을 둔 오프라인 STT, TTS 및 번역이 필요한 Linux 사용자에게 유용한 도구입니다. 모델 선택은 성능에 영향을 줄 수 있지만 오픈 소스 특성과 다양성은 가치있는 옵션입니다.
자원 :
스피치 노트 github 리포지토리
위 내용은 음성 참고 : 오프라인 음성 인식, 텍스트 음성 연설 및 Linux의 번역 앱의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!