点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
4月29日,Qwen3正式发布并全部开源8款混合推理模型。
此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
作为Qwen系列中的最新一代大型语言模型,Qwen3在推理、指令遵循、工具调用、多语言能力等方面进行了全面增强。
据悉,海光DCU迅速完成对全部8款模型(235B/32B/30B/14B/8B/4B/1.7B/0.6B)的无缝适配+深度调优,确保大模型算力“零等待”部署。基于GPGPU架构强大的生态优势,与编程开发软件栈DTK的特性,Qwen3在海光DCU上展现出优异的性能,充分验证海光DCU高通用性、高生态兼容度及自主可控的技术优势,已成为支撑AI大模型训练与推理的关键基础设施。
旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹。Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
现在,全球开发者、研究机构和企业均可免费在光源(www.sourcefind.cn)下载模型并商用,进一步打造高度定制化的AI解决方案。(科文)