Speakr

软件描述

Speakr 是一款个人化、自托管的网络应用程序,可用于转录音频记录(如会议)、生成简洁的摘要和标题,并通过聊天界面与内容进行互动。所有会议笔记和见解都将安全地存储在您自己的服务器上。

官方网站

访问软件的官方网站了解更多信息

官方认证

github.com

安全链接HTTPS

什么是 Speakr?

Speakr 是一个个人化、可自托管的网络应用程序,专为转录音频记录(如会议)、生成简洁摘要和标题,以及通过聊天界面与内容进行交互而设计。所有会议笔记和洞察均安全存储在您自己的服务器上。

功能特性:

核心功能:

音频上传:支持通过拖放或文件选择方式上传音频文件(如 MP3、WAV、M4A 等)。 后台处理:转录和摘要在后台进行,不会阻塞用户界面。 转录:使用兼容 OpenAI 的语音转文字(STT)API(可配置,例如支持自托管的 Whisper)。 AI 摘要与标题生成:通过兼容 OpenAI 的 LLM API(如 OpenRouter)使用可配置的大语言模型生成简洁的标题和摘要。 交互式聊天:可使用 AI 模型向转录内容提问并进行互动。 元数据编辑:可编辑与录音相关的标题、参会人员、会议日期、摘要和笔记。

用户功能:

身份验证:提供安全的用户注册和登录系统。 账户管理:用户可更改密码。 录音画廊:查看、管理和访问所有个人录音。 深色模式:可在浅色主题和深色主题之间切换。

管理功能:

管理仪表板:集中管理后台任务(路径为 /admin)。 用户管理:可添加、编辑、删除用户,并授予或撤销管理员权限。 系统统计:查看整体使用情况统计数据(包括总用户数、录音数量、存储空间等)。

🔄 替代方案

57 个选择

Txtplay 提供云端和本地化解决方案,支持按需和实时转录、实时字幕生成以及自动翻译。

付费 • 专有
查看详情
Whisper Mate

Whisper Mate

软件

5

使用 OpenAI 的 Whisper AI 模型批量将音频文件或视频文件转录为文本。提供嵌入式字幕编辑器,可逐段预览转录结果。所有转录操作均在本地设备上完成,保障您的隐私安全。

免费增值 • 专有
查看详情
💻

Nerd Dictation

软件

使用 VOSK-API 的简单、可定制的离线语音转文本功能。

免费 • 开源
查看详情

Supernormal 是一个AI平台,可帮助你将会议纪要的撰写速度提升20倍。

免费增值 • 专有
查看详情
💻

CMU Sphinx

软件

CMU Sphinx 是一个基于 BSD 风格许可证发布的、无需特定说话人、支持大规模词汇的连续语音识别系统。它也是一组开源工具和资源的集合,使研究人员和开发者能够构建语音识别系统。

免费 • 开源
查看详情
Buzz Captions

Buzz Captions

音频转写工具

5

Buzz Captions 是一款基于 OpenAI Whisper 模型的离线音频转录与翻译工具,用户可以导入音频和视频文件,生成 CSV、SRT、TXT 和 VTT 格式的字幕文本。

付费 • 开源
查看详情

Letterly 是一款移动应用,可将任意语音转换为清晰且结构良好的文本。它不仅仅是语音转文字。借助人工智能技术,你可以将语音转化为结构化的笔记、吸引人的社交媒体帖子、可读的会议纪要、正式的邮件等。

免费增值 • 专有
查看详情

流畅完美的语音输入。

免费 • 专有
查看详情
上一页下一页

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。