Whisper

软件描述

Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一种多任务模型,能够执行多语言语音识别、语音翻译和语言识别。

官方网站

访问软件的官方网站了解更多信息

官方认证

openai.com

安全链接HTTPS
立即访问

什么是 Whisper?

Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。

🔄 替代方案

116 个选择
Transcriptor

Transcriptor

0

使用此易于导航的工具,高效地将语音转换为文本。支持20种语言(从英语到越南语)实时转录,并通过iCloud安全存储。

Scribe Video Transcripts

Scribe Video Transcripts

0

阅读并收听任何YouTube视频的精美标点字幕,与音频同步(横屏显示完整视频)

4

高质量的设备端语音转写。轻松将会议、讲座等的语音转换为文字。

0

语音转文字由人工智能提供支持。自动将音频转换为文本。

5

轻松实现语音转写。说出你的想法,文字将即时呈现在你掌中。语音转文字从未如此简单!可导出并分享你的转写内容给任何人。

0

Speakr 是一款个人自托管的网页应用,用于转录音频记录(如会议),生成简洁的摘要和标题,并通过聊天界面与内容互动。将所有会议笔记和见解安全地保存在您自己的服务器上。

0

VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……

KanjuTech Transcription and Diarization

KanjuTech Transcription and Diarization

0

KanjuTech 自动语音识别(ASR)模型是一种定制的AI解决方案,可生成会议记录、字幕及其他语音转文本任务。KanjuTech ASR 模型通过 AWS 市场以预构建的 SageMaker Docker 镜像形式分发。

上一页下一页
评分4.0 / 5.0

支持平台

标签

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。

GitHub