Text generation web UI

Text generation web UI
★5
软件描述
用于大型语言模型的 Gradio 网页界面。支持 Transformers、GPTQ、llama.cpp(GGUF)和 Llama 模型。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Text generation web UI?
用于大型语言模型的 Gradio 网页界面。
其目标是成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui。
功能特点
- 三种界面模式:默认模式(两列布局)、笔记本模式和聊天模式
- 多种模型后端支持:transformers、llama.cpp、ExLlama、ExLlamaV2、AutoGPTQ、GPTQ-for-LLaMa、CTransformers
- 提供下拉菜单,可快速切换不同模型
- LoRA:支持动态加载和卸载 LoRA 模型,可使用 QLoRA 训练新的 LoRA 模型
- 聊天模式下的精确指令模板,包括 Llama-2-chat、Alpaca、Vicuna、WizardLM、StableLM 等多种模板
- 通过 transformers 库支持 4 位、8 位及 CPU 推理
- 可使用 llama.cpp 模型配合 transformers 的采样器(llamacpp_HF 加载器)
- 多模态管道支持,包括 LLaVA 和 MiniGPT-4
- 扩展框架
- 支持自定义聊天角色
- 高效的文本流式输出
- 支持 Markdown 输出并渲染 LaTeX 公式,例如可与 GALACTICA 配合使用
- 提供 API 接口,包括 WebSocket 流式传输端点(详见示例)
🔄 替代方案
62 个选择Khoj
★4
Khoj 是一个开源的AI第二大脑,能够从你的笔记(如 Obsidian、EMACS)、文档中学习,并可访问互联网。它可以替代你的搜索引擎,帮助你阅读论文,并为你提供透明、快速的答案。
免费增值 • 开源
查看详情
Private GPT
★1
即使没有互联网连接,也可以通过大语言模型对文档提出问题。100%私密,任何数据都不会在任何时刻离开您的执行环境。您可以在没有互联网连接的情况下导入文档并提出问题!
免费 • 开源
查看详情Together Chat 是一款面向消费者的下一代应用,可让您无缝互动于当今最受欢迎的开源模型,包括在北美安全托管的 DeepSeek R1,免费使用。
免费 • 专有
查看详情提供基于人工智能的写作工具、图像生成、Genmoji 和记忆电影功能;通过更深层次的上下文和操作增强 Siri;集成 ChatGPT 以处理复杂任务;优先在设备端进行处理以保障隐私;通过 Private Cloud Compute 在苹果各设备间统一功能。
免费 • 专有
查看详情