FUTO Voice Input

FUTO Voice Input
软件描述
FUTO语音输入是一款可在Android上实现语音转文字的应用程序,可与支持通用语音转文字API的第三方输入法或应用集成。
官方网站
访问软件的官方网站了解更多信息
voiceinput.futo.org
什么是 FUTO Voice Input?
FUTO语音输入是一款可在Android上实现语音转文字的应用程序,支持与第三方键盘或使用通用语音转文字API的应用程序集成。
键盘支持
应用的帮助部分提到了键盘支持情况。简而言之,以下键盘受支持:
- AOSP键盘,使用IME
- OpenBoard,使用IME
- AnySoftKeyboard,使用隐式意图。该键盘存在一些语音输入可用性问题,但正在改进中
如果您愿意使用专有键盘,以下键盘也受支持:
- Grammarly键盘,使用IME
- Microsoft SwiftKey,使用隐式意图
语言支持
FUTO语音输入目前基于OpenAI Whisper模型,理论上可支持OpenAI Whisper所支持的所有语言。然而,实际使用中,较小的模型在训练时长较少的语言上表现不佳。为避免提供比无用更差的结果,用户界面中仅包含训练时长超过1000小时的语言选项。
未来通过更好的优化和微调模型,语言支持范围和准确性有望进一步提升。欢迎就语言相关问题或整体语言准确率提供反馈。
🔄 替代方案
91 个选择
Whisper
Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一种多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
SpeechPulse 是一款适用于 Windows 10/11 和 Apple Silicon Mac 的语音输入软件。它可向任何文本输入框输入文字,包括文本编辑器、网页浏览器和办公应用。SpeechPulse 完全离线运行,无需互联网连接。
一款由人工智能驱动的工具,可将音频转换为多种内容形式,从文章到问答。无论上传文件、同步信息源还是导入链接,都能在几秒钟内自动完成文案撰写、编辑和草稿生成。非常适合需要快速高效内容转换的创作者。

Supernormal
超常是帮助您将会议记录撰写速度提升20倍的人工智能平台。

Meeting Recorder
会议记录器是您会议的个人助手。它会倾听并为您转录会议和研讨会内容,让您能够搜索录音中的关键词和短语。您可以记录最重要的对话,节省时间,帮助您更高效地工作……

Kaldi
Kaldi 是一个用 C++ 编写的语音识别工具包,采用 Apache 许可证 v2.0。Kaldi 旨在供语音识别研究人员使用。

Sayboard
该项目使用 Vosk 实现语音键盘,基于 https://github.com/Felicis/vosk-android-demo。





