发现各种软件替代方案,找到更适合您的选择
筛选条件
排序方式
Mycroft is an open source voice assistant, that can be installed on Linux, Raspberry Pi, or on the Mark 1 hardware device.
在输入和语音之间切换,轻松记笔记,支持40种语言。实时转录可捕捉段落和表情符号,同时确保标点清晰。Pro版本提供云端存储以及多种笔记管理选项。
提供 112 个替代方案
Talking to Siri is an easier, faster way to get things done. It’s always with you — on your iPhone, iPad, Mac, Apple Watch, Apple TV, and HomePod.
通过语音指令和语音输入与您的电脑互动。支持文本格式化、网页搜索和发送电子邮件等任务。适用于 PC、Mac、iPhone、iPad 和 Android 设备,通过免动手操作提升工作效率和可及性。
提供 61 个替代方案

软件
Hound combines Speech Recognition and Language Understanding. This Speech-to-Meaning capability makes Hound the new way to search and do things faster without typing.
Whisper 是一个通用的语音识别模型。它在大量多样化的音频数据集上进行训练,同时是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
提供 111 个替代方案
一款智能笔记解决方案,可记录、转录并共享英文语音对话。Otter.ai 可用于会议、讲座、记者采访等多种场景,提供发言人识别、嵌入图片、带词高亮的播放、日历集成以及便捷的团队协作功能。
提供 100 个替代方案
Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。
提供 64 个替代方案

软件
“Chrome 的 Siri”无需动手即可完全控制浏览器——只需说出“谷歌附近有哪些电影正在放映”即可进行搜索,通过语音上下滚动,点击任意链接,打开标签页,访问你最喜爱的网站等,一切操作仅靠语音即可完成。
提供 29 个替代方案
VoiceCraft 是一种令牌填充神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上的语音编辑和零样本文本到语音(TTS)任务中均取得了最先进的性能。
Moonshine 是一系列为在资源受限设备上实现快速且准确的自动语音识别(ASR)而优化的语音转文本模型,适用于实时、本地化应用,如实时字幕转录和语音指令识别。
提供 75 个替代方案
筛选条件
排序方式
Mycroft is an open source voice assistant, that can be installed on Linux, Raspberry Pi, or on the Mark 1 hardware device.
在输入和语音之间切换,轻松记笔记,支持40种语言。实时转录可捕捉段落和表情符号,同时确保标点清晰。Pro版本提供云端存储以及多种笔记管理选项。
提供 112 个替代方案
Talking to Siri is an easier, faster way to get things done. It’s always with you — on your iPhone, iPad, Mac, Apple Watch, Apple TV, and HomePod.
通过语音指令和语音输入与您的电脑互动。支持文本格式化、网页搜索和发送电子邮件等任务。适用于 PC、Mac、iPhone、iPad 和 Android 设备,通过免动手操作提升工作效率和可及性。
提供 61 个替代方案

软件
Hound combines Speech Recognition and Language Understanding. This Speech-to-Meaning capability makes Hound the new way to search and do things faster without typing.
Whisper 是一个通用的语音识别模型。它在大量多样化的音频数据集上进行训练,同时是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
提供 111 个替代方案
一款智能笔记解决方案,可记录、转录并共享英文语音对话。Otter.ai 可用于会议、讲座、记者采访等多种场景,提供发言人识别、嵌入图片、带词高亮的播放、日历集成以及便捷的团队协作功能。
提供 100 个替代方案
Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。
提供 64 个替代方案

软件
“Chrome 的 Siri”无需动手即可完全控制浏览器——只需说出“谷歌附近有哪些电影正在放映”即可进行搜索,通过语音上下滚动,点击任意链接,打开标签页,访问你最喜爱的网站等,一切操作仅靠语音即可完成。
提供 29 个替代方案
VoiceCraft 是一种令牌填充神经编解码语言模型,在包括有声书、网络视频和播客在内的真实场景数据上的语音编辑和零样本文本到语音(TTS)任务中均取得了最先进的性能。
Moonshine 是一系列为在资源受限设备上实现快速且准确的自动语音识别(ASR)而优化的语音转文本模型,适用于实时、本地化应用,如实时字幕转录和语音指令识别。
提供 75 个替代方案