Nerd Dictation
💻
Nerd Dictation
软件
软件描述
使用 VOSK-API 的简单、可定制的离线语音转文本功能。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Nerd Dictation?
适用于桌面 Linux 的离线语音转文本工具。
这是一个实用程序,通过使用出色的 VOSK-API,为在不依赖桌面环境的 Linux 系统中实现简单的语音转文本功能。
简单——这是一段仅包含少量依赖项的单文件 Python 脚本。
可定制——用户配置允许通过 Python 字符串操作对文本进行处理。
零开销——由于该工具依赖手动激活,因此没有后台进程。
通过手动输入开始和结束命令来启动和结束语音输入。
🔄 替代方案
36 个选择💻
CMU Sphinx
软件
CMU Sphinx 是一个基于 BSD 风格许可证发布的、无需特定说话人、支持大规模词汇的连续语音识别系统。它也是一组开源工具和资源的集合,使研究人员和开发者能够构建语音识别系统。
免费 • 开源
查看详情Amphion 是一个用于音频、音乐和语音生成的工具包。其目的是支持可重复的研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成领域的研究与开发。
免费 • 开源
查看详情