您的当前位置:首页>科技咨询>资讯详情

阿里开源新模型:仅用1/20参数比肩满血DS-R1,

发表于:2025-03-06 13:00:06 浏览:38次 发布者: 网易互联网

3月6日凌晨,阿里云发布并开源全新的推理模型通义千问QwQ-32B。官方称,这个新模型仅仅拥有320亿参数,但在性能上比肩6710亿参数的满血版DeepSeek R1。


目前,阿里云并未发布还完整技术报告,但官方数据显示,QwQ-32B仅在编程竞赛(LiveCodeBench)和美国数学竞赛(AIME24)两项略逊于满血的DeepSeek-R1,其余三项则全面超越。此外更是碾压完全超越了OpenAI-o1-mini。

阿里云解释称,团队此次基于Qwen2.5-32B模型,探索了扩展强化学习(RL)的技术方案,并发现强化学习训练能够持续提升模型性能,尤其在数学与编程任务中表现显著。该团队还提到,通过持续扩展强化学习训练的规模,中型模型也可以实现与巨型混合专家模型(MoE)相媲美的性能。

此外,QwQ-32B还满足更低的资源消耗需求,适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级显卡上将其部署到本地设备中,进一步打造高度定制化的AI解决方案。阿里称,QwQ-32B已多个平台基于宽松的Apache2.0协议开源,所有人都可免费下载模型进行本地部署,或者通过阿里云百炼平台直接调用模型API服务。


值得一提的是,此前OpenAI曾因遇到技术瓶颈,将原来的GPT5.0降格为GPT4.5进行发布,之后还透露将降低强化学习训练的优先级,转向监督学习(SSL)和语言模型(LM)为核心的技术路线。而QwQ-32B的发布则证明了强化学习路线仍有潜力,可以继续提升模型的性能。

千问QwQ-32B模型中还集成了与智能体Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

逼近Claude 3.5、成本降低86%,开源代码定位新
逼近Claude 3.5、成本降低86%,开源代码定位新
发表于:2025-05-28 浏览:30 发布者: 网易互联网
8点1氪|被五月天粉丝质疑抄袭,老庙黄金道歉;
8点1氪|被五月天粉丝质疑抄袭,老庙黄金道歉;
发表于:2025-08-28 浏览:14 发布者: 网易互联网
消息称阿里AI智能眼镜方案确定:天猫精灵团队负
消息称阿里AI智能眼镜方案确定:天猫精灵团队负
发表于:2025-04-08 浏览:36 发布者: 网易科技
电商“包邮区”持续西进 撬动国内消费大循环
电商“包邮区”持续西进 撬动国内消费大循环
发表于:2025-06-14 浏览:28 发布者: 网易互联网
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破
发表于:2025-05-29 浏览:28 发布者: 网易科技
踢球遛狗做三明治,机器人在全球开发者先锋大会
踢球遛狗做三明治,机器人在全球开发者先锋大会
发表于:2025-02-22 浏览:42 发布者: 网易科技
看完最近发布的这批新机 联发科这次是真的支棱起来了!
看完最近发布的这批新机 联发科这次是真的支棱起来了!
发表于:2024-10-31 浏览:104 发布者: 快科技官方
“好评如潮”的商品靠谱吗?记者调查网店刷好评现象
“好评如潮”的商品靠谱吗?记者调查网店刷好评现象
发表于:2024-11-09 浏览:50 发布者: 环球时报
茂莱仪器申请适用于AR检测的长出瞳距远心镜头专
茂莱仪器申请适用于AR检测的长出瞳距远心镜头专
发表于:2025-07-15 浏览:21 发布者: 网易科技
爱奇艺奏响微短剧精品化序章
爱奇艺奏响微短剧精品化序章
发表于:2025-04-01 浏览:33 发布者: 网易互联网