FUTO Voice Input

FUTO Voice Input
软件描述
FUTO语音输入是一款适用于Android的语音转文本应用程序,可与第三方键盘或使用通用语音转文本API的应用程序集成。
官方网站
访问软件的官方网站了解更多信息
voiceinput.futo.org
什么是 FUTO Voice Input?
FUTO语音输入是一款可在安卓设备上实现语音转文字的应用程序,它可与第三方键盘或使用通用语音转文字API的应用程序进行集成。
键盘支持
应用程序的帮助部分提到了键盘支持。简而言之,以下键盘是受支持的:
AOSP键盘,使用输入法(IME)
OpenBoard键盘,使用输入法(IME)
AnySoftKeyboard键盘,使用隐式意图(implicit intent)。该键盘存在一些语音输入的可用性问题,但目前正在积极改进。
如果您可以接受使用专有键盘,以下键盘也受到支持:
Grammarly键盘,使用输入法(IME)
微软SwiftKey键盘,使用隐式意图
语言支持
FUTO语音输入目前基于OpenAI Whisper模型,理论上可支持OpenAI Whisper支持的所有语言。然而,实际上较小的模型在训练时长较少的语言上表现不佳。为避免呈现比无任何支持更差的结果,UI中仅包含训练时长超过1000小时的语言选项。
未来随着优化改进和微调模型的完善,语言支持和识别准确率可能会进一步提升。欢迎就与语言相关的问题或整体语言识别准确性提供反馈。
🔄 替代方案
87 个选择
Whisper Mate
软件
使用 OpenAI 的 Whisper AI 模型批量将音频文件或视频文件转录为文本。提供嵌入式字幕编辑器,可逐段预览转录结果。所有转录操作均在本地设备上完成,保障您的隐私安全。
CMU Sphinx
软件
CMU Sphinx 是一个基于 BSD 风格许可证发布的、无需特定说话人、支持大规模词汇的连续语音识别系统。它也是一组开源工具和资源的集合,使研究人员和开发者能够构建语音识别系统。

Buzz Captions
Buzz Captions 是一款基于 OpenAI Whisper 模型的离线音频转录与翻译工具,用户可以导入音频和视频文件,生成 CSV、SRT、TXT 和 VTT 格式的字幕文本。