您的当前位置:首页>科技咨询>资讯详情

腾讯推出自研深度思考模型混元T1,输入价格为1

发表于:2025-03-22 16:00:02 浏览:38次 发布者: 网易互联网

3月21日,腾讯宣布推出自研深度思考模型“混元T1”正式版,并同步在腾讯云官网上线。

该模型以腾讯于3月初发布的“混元Turbo S”为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。

通过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的“混元T1-preview”模型相比,综合效果明显提升。

混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

这一架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache(一种大模型推理性能优化技术)的内存占用,从而显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度最快可达80tokens/s(Token意为处理文本的最小单元)。

目前,混元T1已在腾讯云官网上线,输入价格为1元/每百万tokens,输出价格为4元/百万tokens 。

猜你喜欢

饿了么前CEO巨贪案:供应链管理失能
饿了么前CEO巨贪案:供应链管理失能
发表于:2025-07-26 浏览:21 发布者: 网易互联网
平头哥镇岳510规模上线阿里云
平头哥镇岳510规模上线阿里云
发表于:2025-03-13 浏览:42 发布者: 网易互联网
飞猪提升至淘宝App一级入口
飞猪提升至淘宝App一级入口
发表于:2025-08-07 浏览:17 发布者: 网易互联网
行业生态重构中的革新之变:何谓品质,何以京东
行业生态重构中的革新之变:何谓品质,何以京东
发表于:2025-05-16 浏览:28 发布者: 网易互联网
节后物流排头兵, 德邦快递助力商家抢占市场先
节后物流排头兵, 德邦快递助力商家抢占市场先
发表于:2025-02-06 浏览:70 发布者: 网易互联网
阿里巴巴开源视频生成与编辑模型通义万相Wan2.1
阿里巴巴开源视频生成与编辑模型通义万相Wan2.1
发表于:2025-05-15 浏览:35 发布者: 网易互联网
原美团平台技术部负责人司天歌离职,大象已经显
原美团平台技术部负责人司天歌离职,大象已经显
发表于:2025-08-22 浏览:16 发布者: 网易互联网
到底有多少人,为了双11学习如何凑单退款?
到底有多少人,为了双11学习如何凑单退款?
发表于:2024-11-13 浏览:61 发布者: 网易互联网
本田和日产合并的最大问题:时间真的不等人
本田和日产合并的最大问题:时间真的不等人
发表于:2024-12-25 浏览:52 发布者: 网易IT
美团全面拓展即时零售,闪购、小象、优选“三箭
美团全面拓展即时零售,闪购、小象、优选“三箭
发表于:2025-06-24 浏览:24 发布者: 网易互联网