Qwen3：阿里巴巴云Qwen团队开发的大语言模型

AIProductHub

4个月前更新

2628

Qwen3 & Qwen3-TTS 产品信息整理

📌 产品概述

Qwen3是阿里巴巴云Qwen团队开发的大语言模型系列，Qwen3-TTS是该团队推出的开源文本转语音模型。

Qwen3 Github地址：https://github.com/QwenLM/Qwen3

🎯 Qwen3-TTS 详细信息

核心功能特点

语音设计功能：用户可以通过描述人物特征（如“悲伤的老人”）来生成相应的语音
高效技术：使用12Hz的标记器压缩语音而不丢失细节，将延迟降至97毫秒
多语言支持：支持10种语言
极低延迟：延迟仅为97毫秒，支持流媒体功能
语音克隆：支持3秒零样本克隆

技术规格

特性	规格
模型规模	0.6B和1.7B两种规模
延迟	97毫秒
语音克隆	3秒零样本克隆
开源协议	完全开源

用户评价与比较

优点：

速度快、轻量级，适合快速迭代和原型设计
在代码生成和网站构建方面表现优异
与GPT-4o相比，在速度和成本上更具优势
图像到文本处理方面表现出色，是小型LLM中的佼佼者

改进建议：

需要更好的历史记录管理
简化边缘案例的处理
减少额外提示的需求

🚀 Qwen3 详细信息

版本信息

最新版本：Qwen3-2507，包含两种变体：

Instruct模式：非思考模式
Thinking模式：思考模式

模型规模

三种规模版本：

235B-A22B
30B-A3B
4B

关键技术特性

核心功能：

支持256K长上下文理解（可扩展至100万token）
超长上下文支持：2025.08.08更新后支持100万token输入
多框架兼容：支持Transformers、ModelScope、llama.cpp等

版本发布历史

发布日期	版本	重要更新
2025.07.21-08.06	Qwen3-2507	发布235B-A22B/30B-A3B/4B的Instruct和Thinking版本
2025.04.29	Qwen3系列	首次发布
2024.09.19	Qwen2.5系列	前代版本
2024.06.06	Qwen2系列	前代版本

技术特性

Qwen3-Instruct-2507：显著提升指令遵循、逻辑推理、文本理解能力
Qwen3-Thinking-2507：在逻辑推理、数学/科学/编码任务上达到开源思考模型的SOTA水平
思考模式解析：默认输出含思考过程，需通过token ID 151668分割

许可与引用

采用Apache 2.0许可证
提供Qwen3技术报告（arXiv:2505.09388）

💡 总结

Qwen3系列是阿里巴巴云Qwen团队推出的先进AI模型产品线，其中Qwen3作为大语言模型支持256K超长上下文和思考模式，在逻辑推理和代码能力方面表现卓越；而Qwen3-TTS作为文本转语音模型，以97毫秒的超低延迟、多语言支持和优秀的语音克隆能力著称。两者均完全开源，采用Apache 2.0协议，为开发者提供了高质量的AI解决方案，特别在速度、成本效益和技术创新方面具有显著优势。

Qwen3 Qwen3-TTS 大语言模型阿里巴巴

1人已评分