Whisper

音频转录工具

★4

软件描述

Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练，同时也是一种多任务模型，能够执行多语言语音识别、语音翻译和语言识别。

官方网站

访问软件的官方网站了解更多信息

官方认证

openai.com

安全链接HTTPS

立即访问

什么是 Whisper?

Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练，同时也是一个多任务模型，能够执行多语言语音识别、语音翻译和语言识别。

主要功能

✓ 语音转文字 ✓ 语音识别 ✓ 无广告 ✓ 语音转录

🔄 替代方案

116 个选择

Transcriptor

音频转录工具

使用此易于导航的工具，高效地将语音转换为文本。支持20种语言（从英语到越南语）实时转录，并通过iCloud安全存储。

Scribe Video Transcripts

音频转录工具, 视频转录工具

阅读并收听任何YouTube视频的精美标点字幕，与音频同步（横屏显示完整视频）

Aiko

音频转录工具, 视频转录工具

★4

高质量的设备端语音转写。轻松将会议、讲座等的语音转换为文字。

Go Transcribe

音频转录工具, 视频转录工具

语音转文字由人工智能提供支持。自动将音频转换为文本。

writtan

音频转录工具

★5

轻松实现语音转写。说出你的想法，文字将即时呈现在你掌中。语音转文字从未如此简单！可导出并分享你的转写内容给任何人。

Speakr

音频转录工具

Speakr 是一款个人自托管的网页应用，用于转录音频记录（如会议），生成简洁的摘要和标题，并通过聊天界面与内容互动。将所有会议笔记和见解安全地保存在您自己的服务器上。

VibeVoice

语音合成服务, 大型语言模型（LLM）工具

VibeVoice 是一种新型框架，可从文本生成富有表现力的长篇多说话人对话音频，例如播客。它解决了传统文本转语音（TTS）系统中的诸多挑战，特别是在可扩展性、说话人一致性等方面……

KanjuTech Transcription and Diarization

音频转录工具, 视频转录工具

KanjuTech 自动语音识别（ASR）模型是一种定制的AI解决方案，可生成会议记录、字幕及其他语音转文本任务。KanjuTech ASR 模型通过 AWS 市场以预构建的 SageMaker Docker 镜像形式分发。

许可证免费增值 • 开源

评分4.0 / 5.0

支持平台

Mac Windows Linux

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站，请确保来源安全，建议优先从官方网站下载。

雷思软件

Whisper

Whisper

软件描述

官方网站

什么是 Whisper?

主要功能

🔄 替代方案

Transcriptor

Scribe Video Transcripts

Aiko

Go Transcribe

writtan

Speakr

VibeVoice

KanjuTech Transcription and Diarization

支持平台

标签

下载与相关链接