Whisper

Whisper
★4
软件描述
Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一种多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
官方网站
访问软件的官方网站了解更多信息
官方认证
openai.com
安全链接HTTPS
什么是 Whisper?
Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
🔄 替代方案
116 个选择
Transcriptor
使用此易于导航的工具,高效地将语音转换为文本。支持20种语言(从英语到越南语)实时转录,并通过iCloud安全存储。

writtan
★5
轻松实现语音转写。说出你的想法,文字将即时呈现在你掌中。语音转文字从未如此简单!可导出并分享你的转写内容给任何人。
Speakr
Speakr 是一款个人自托管的网页应用,用于转录音频记录(如会议),生成简洁的摘要和标题,并通过聊天界面与内容互动。将所有会议笔记和见解安全地保存在您自己的服务器上。

VibeVoice
VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……





