Qwen

Qwen
软件描述
阿里云通用人工智能模型。
官方网站
访问软件的官方网站了解更多信息
chat.qwen.ai
什么是 Qwen?
通义千问是由阿里云研发的大语言模型系列。 通义团队致力于追求通用人工智能,目前专注于构建通用模型,包括大语言模型和大多模态模型。我们坚持开源理念,此前已发布通义千问系列模型,涵盖语言模型(Qwen)、专家模型(Qwen-Coder 和 Qwen-Math)以及多模态模型(Qwen-VL 和 Qwen-Audio)。 最新推出的模型 Qwen2.5 具备以下特性:
- 密集型、易用的仅解码器语言模型,提供 0.5B、1.5B、3B、7B、14B、32B 和 72B 七种规模,包含基础版与指令微调版。
- 基于最新的大规模数据集预训练,涵盖高达 18T 标记。
- 在遵循指令、生成长文本(超过 8K 标记)、理解结构化数据(如表格)及生成结构化输出(尤其是 JSON)方面实现显著提升。
- 对系统提示的多样性更具鲁棒性,增强聊天机器人的角色扮演与条件设定能力。
- 支持最长 128K 标记的上下文长度,可生成最多 8K 标记。
- 支持超过 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。
🔄 替代方案
83 个选择
Apertus
作为一款完全开源的语言模型,Apertus允许研究人员、专业人士和爱好者基于该模型进行开发,并根据自身需求对其进行调整,同时也可检查训练过程的任何部分。

Grok
Grok是一款由xAI开发的生成式人工智能聊天机器人。基于同名大型语言模型,该聊天机器人于2023年由埃隆·马斯克发起推出。其宣传称具备“幽默感”并可直接访问X。
Microsoft Copilot
Microsoft Copilot(此前称为Bing Chat)是微软必应推出的一项新聊天机器人功能,旨在通过人工智能技术彻底改变搜索引擎的体验。
Claude
Claude 是基于 Anthropic 在训练有益、诚实且无害的 AI 系统方面的研究成果而开发的下一代人工智能助手。通过开发者控制台中的聊天界面和 API 可以访问 Claude,它能够完成多种对话和文本处理任务……

Poe
Poe 使您能够提出问题、获得即时回答,并与人工智能进行多轮对话。包含来自 Anthropic 的 Claude 及多种其他机器人。

Farfalle
开源人工智能驱动的答案引擎。

Meta Llama
作为Meta致力于开放科学的一部分,今天我们正式发布Llama(大型语言模型Meta AI),这是一个最先进的基础大型语言模型,旨在帮助研究人员推进该人工智能子领域的研究工作。
Mellum
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。


