您的当前位置:首页>科技咨询>资讯详情

腾讯混元开源首款混合推理MoE模型

发表于:2025-06-29 03:44:56 浏览:26次 发布者: 网易互联网

6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

即日起,模型已经在 Github 和 Huggingface 等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。


加粗为最高分,下划线是第二名,数据来源于模型公开的测试数据集得分

对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。

在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在多个长文数据集中取得了优异的成绩。



在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加think/no_think切换思考模式,在效率和特定任务准确性之间取得平衡。

相关资料显示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有超过400+业务用于精调或者直接调用,日均请求超1.3亿。


混元官方界面截图

官方界面中显示,该模型支持快慢思考模式切换,数学、科学、长文理解及Agent能力全面提升。其中,快思考模式适合追求速度和最小计算开销的简单任务,而慢思考模式则涉及更深、更全面的推理步骤,这优化了计算资源分配,兼顾了效率和准确性。

在实测中,观察者网测试了小数比较大小,基本的四则运算等多种基本数学题目,Hunyuan-A13B模型都能迅速响应并给出正确的回答。


测试问题

据悉,混元团队还开源了两个新数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench主要用于代码评估,构建了一个包含1825个任务的新基准;C3-Bench则针对Agent场景模型评估,设计了1024条测试数据。

本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

阿里巴巴涨近5% 阿里云百炼qwen-max系列模型官
阿里巴巴涨近5% 阿里云百炼qwen-max系列模型官
发表于:2025-02-03 浏览:47 发布者: 网易互联网
微信又有新变化
微信又有新变化
发表于:2025-04-04 浏览:35 发布者: 网易互联网
“科技+文化”双轮驱动,构建人工智能新时代
“科技+文化”双轮驱动,构建人工智能新时代
发表于:2024-12-29 浏览:56 发布者: 网易科技
张朝阳出席2024世界互联网大会 共话互联网行业发展新机遇
张朝阳出席2024世界互联网大会 共话互联网行业发展新机遇
发表于:2024-11-22 浏览:62 发布者: 新浪科技
山东虚拟现实产业链企业达260余家
山东虚拟现实产业链企业达260余家
发表于:2024-11-18 浏览:78 发布者: 网易科技
谷歌Chrome浏览器在Speedometer 3性能测试中创
谷歌Chrome浏览器在Speedometer 3性能测试中创
发表于:2025-06-06 浏览:31 发布者: 网易互联网
方针变了!Meta将允许其AI模型用于美国军事目的
方针变了!Meta将允许其AI模型用于美国军事目的
发表于:2024-11-05 浏览:86 发布者: 网易科技
美国法官裁定 FTC 诉 Meta 垄断社交媒体案明年
美国法官裁定 FTC 诉 Meta 垄断社交媒体案明年
发表于:2024-11-26 浏览:62 发布者: 网易科技
Caviar推出iPhone 16 Pro系列 致敬乔布斯、马斯克等
Caviar推出iPhone 16 Pro系列 致敬乔布斯、马斯克等
发表于:2024-11-13 浏览:75 发布者: CNMO
DeepSeek R1悄悄更新!用「小版本」干翻大模型
DeepSeek R1悄悄更新!用「小版本」干翻大模型
发表于:2025-05-29 浏览:31 发布者: 网易互联网