FUTO Voice Input

FUTO Voice Input
软件描述
FUTO语音输入是一款适用于Android的语音转文本应用程序,可与第三方键盘或使用通用语音转文本API的应用程序集成。
官方网站
访问软件的官方网站了解更多信息
voiceinput.futo.org
什么是 FUTO Voice Input?
FUTO语音输入是一款可在安卓设备上实现语音转文字的应用程序,它可与第三方键盘或使用通用语音转文字API的应用程序进行集成。
键盘支持
应用程序的帮助部分提到了键盘支持。简而言之,以下键盘是受支持的:
AOSP键盘,使用输入法(IME)
OpenBoard键盘,使用输入法(IME)
AnySoftKeyboard键盘,使用隐式意图(implicit intent)。该键盘存在一些语音输入的可用性问题,但目前正在积极改进。
如果您可以接受使用专有键盘,以下键盘也受到支持:
Grammarly键盘,使用输入法(IME)
微软SwiftKey键盘,使用隐式意图
语言支持
FUTO语音输入目前基于OpenAI Whisper模型,理论上可支持OpenAI Whisper支持的所有语言。然而,实际上较小的模型在训练时长较少的语言上表现不佳。为避免呈现比无任何支持更差的结果,UI中仅包含训练时长超过1000小时的语言选项。
未来随着优化改进和微调模型的完善,语言支持和识别准确率可能会进一步提升。欢迎就与语言相关的问题或整体语言识别准确性提供反馈。
🔄 替代方案
87 个选择SpeechText.AI 的核心功能是领域专用的语音识别技术。借助这款音频转录软件,您可以为金融、人力资源、法律、教育、医疗、信息技术等多个领域获取准确的转录文本。

VibeVoice
VibeVoice 是一种新颖的框架,旨在从文本生成具有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本到语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面。

AssemblyAI
AssemblyAI 是一个语音识别API。他们开发了“准确、简单且可定制”的技术,团队称这项技术就像Stripe对支付领域所做的那样,只不过应用于语音领域。由于Siri、Alexa和Google Home等产品的流行,语音技术行业正快速发展。