FUTO Voice Input

FUTO Voice Input
软件描述
FUTO语音输入是一款适用于Android的语音转文本应用程序,可与第三方键盘或使用通用语音转文本API的应用程序集成。
官方网站
访问软件的官方网站了解更多信息
voiceinput.futo.org
什么是 FUTO Voice Input?
FUTO语音输入是一款可在安卓设备上实现语音转文字的应用程序,它可与第三方键盘或使用通用语音转文字API的应用程序进行集成。
键盘支持
应用程序的帮助部分提到了键盘支持。简而言之,以下键盘是受支持的:
AOSP键盘,使用输入法(IME)
OpenBoard键盘,使用输入法(IME)
AnySoftKeyboard键盘,使用隐式意图(implicit intent)。该键盘存在一些语音输入的可用性问题,但目前正在积极改进。
如果您可以接受使用专有键盘,以下键盘也受到支持:
Grammarly键盘,使用输入法(IME)
微软SwiftKey键盘,使用隐式意图
语言支持
FUTO语音输入目前基于OpenAI Whisper模型,理论上可支持OpenAI Whisper支持的所有语言。然而,实际上较小的模型在训练时长较少的语言上表现不佳。为避免呈现比无任何支持更差的结果,UI中仅包含训练时长超过1000小时的语言选项。
未来随着优化改进和微调模型的完善,语言支持和识别准确率可能会进一步提升。欢迎就与语言相关的问题或整体语言识别准确性提供反馈。
🔄 替代方案
87 个选择Vibe 是一项自动语音转录服务,利用本地语言学习模型(LLMs)或人工智能技术,为多种语言提供转录服务。该服务注重用户隐私,提供完全离线的转录功能,确保数据永远不会……
Voxtral
Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。

Moonshine AI
Moonshine 是一系列为在资源受限设备上实现快速且准确的自动语音识别(ASR)而优化的语音转文本模型,适用于实时、本地化应用,如实时字幕转录和语音指令识别。
TalkNotes利用支持100多种语言的AI语音识别技术,将音频转换为结构化的笔记、待办事项、记忆卡片和字幕。可自动将讲座、会议或任何讲话内容转化为可操作的文本,确保任务不会丢失,并为所有用户提供了易于使用的访问体验。