首页 > 系统教程 > 操作系统 > 语音注意:Linux的脱机语音识别,文本到语音和翻译应用

语音注意:Linux的脱机语音识别,文本到语音和翻译应用

William Shakespeare
发布: 2025-03-10 10:10:11
原创
791 人浏览过

>语音注意:脱机,以隐私为中心的语音到文本,文本到语音和Linux的翻译工具 语音注释是一个开源应用程序,通过提供脱机语音到文本(STT),文本到语音(TTS)和机器翻译(MT)功能来确定用户隐私的优先级。 这使您可以创建,审查和翻译多种语言的笔记,而无需将数据发送到Internet。

>关键功能:

完整的离线功能:
    所有处理都在您的设备上发生,保护您的隐私。
  • >多种语言支持:支持STT,TTS和MT的多种语言,并连续添加。
  • >
  • >多个引擎选项:为每个功能提供各种处理引擎的灵活性(请参见下文)。
  • 自定义模型支持:高级用户可以集成与受支持的引擎兼容的自定义模型。>
  • 免费和开源:
  • > Mozilla公共许可证版本2.0。 >
  • >平台:
  • >当前可用于Linux和Sailfish OS。 >支持引擎:
  • stt(语音到文本): coqui stt,vosk,hisper.cpp,更快的耳语,4月-ASR
  • >

> tts(文本到语音): Espeak-ng,mbrola,piper,rhvoice,coqui tts,bimic 3,wheperspeech

  • > mt(机器翻译): bergamot translator
  • Linux安装:
  • >语音注释可以通过Flathub和Arch用户存储库(AUR)轻松获得。
  • > flathub(对于大多数Linux发行版):
  • > 确保安装Flatpak。然后,使用此命令:
考虑以下包装选项:

>

基本软件包(net.mkiol.speechnote):

完整的功能,但需要实质性的磁盘空间。 AMD(net.mkiol.speechnote.addon.amd)和nvidia(net.mkiol.mkiol.speechnote.addon.nvidia)。

微型软件包:

较小的,用于有限空间的用户的基本功能。

flatpak install flathub net.mkiol.SpeechNote
登录后复制

Arch Linux/aur(Arch Linux,Endeavouros,Manjaro Linux):
  • 使用Paru或Yay等Aur助手:
  • >用法:
    1. 启动:运行flatpak run net.mkiol.SpeechNote或从您的应用程序菜单启动。
    2. 语言选择:最初的启动将指导您通过语言选择。 您可以稍后在“语言”选项卡中进行调整。
    3. >
    4. 模型下载:>下载STT,TTS和MT的必要模型文件。 单击“信息”按钮以获取每种型号的详细信息。
    5. >文本到语音:键入文本,然后单击“读”。
    6. >
    7. 语音到文本:单击“听”然后说话到您的麦克风中。
    8. 翻译:使用“翻译器”部分,输入文本并选择您的源和目标语言。为实时翻译启用“翻译时翻译”。

    Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for LinuxSpeech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux

    我的经验:

    >对Debian 12系统(32GB RAM,Intel Core i3 11th,NO GPU)进行的测试,具有特定的英语模型产生了成功的TT和翻译,但是STT性能是不一致的,可能是由于模型选择而引起的。计划进一步测试。

    结论:

    语音注释是需要离线STT,TTS和翻译的Linux用户的宝贵工具,并非常重视隐私。 尽管模型选择可能会影响性能,但其开源性质和多功能性使其成为值得的选择。

    资源:

    >语音注意GitHub存储库

    以上是语音注意:Linux的脱机语音识别,文本到语音和翻译应用的详细内容。更多信息请关注PHP中文网其他相关文章!

    本站声明
    本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
    作者最新文章
    热门教程
    更多>
    最新下载
    更多>
    网站特效
    网站源码
    网站素材
    前端模板