您的当前位置:首页>科技咨询>资讯详情

DeepSeek“开源周”第二天开源EP通信库

发表于:2025-02-25 20:00:04 浏览:39次 发布者: 网易互联网

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。


DeepSeek发布公告截图

编辑 陈莉 校对 柳宝庆

猜你喜欢

一天之内,阿里、腾讯大动作!
一天之内,阿里、腾讯大动作!
发表于:2025-04-30 浏览:36 发布者: 网易互联网
DeepSeek R1模型已完成小版本试升级
DeepSeek R1模型已完成小版本试升级
发表于:2025-05-28 浏览:38 发布者: 网易互联网
TikTok“难民”为何要扎堆小红书?
TikTok“难民”为何要扎堆小红书?
发表于:2025-01-14 浏览:45 发布者: 网易互联网
京东:今年“双十一”活动期间购物用户数同比增
京东:今年“双十一”活动期间购物用户数同比增
发表于:2024-11-12 浏览:55 发布者: 网易互联网
Meta 发布前沿 AI 框架:会暂停开发其认为风险
Meta 发布前沿 AI 框架:会暂停开发其认为风险
发表于:2025-02-04 浏览:52 发布者: 网易科技
淘宝APP推出新功能,网友炸开锅丨有话聊
淘宝APP推出新功能,网友炸开锅丨有话聊
发表于:2025-05-14 浏览:28 发布者: 网易互联网
通用人工智能的哲学之思①|刘永谋:通用人工智能的复杂面孔
通用人工智能的哲学之思①|刘永谋:通用人工智能的复杂面孔
发表于:2024-11-18 浏览:62 发布者: 澎湃新闻
今年双11中国手机销量下跌9% 华OV上涨 米耀果下跌
今年双11中国手机销量下跌9% 华OV上涨 米耀果下跌
发表于:2024-11-23 浏览:93 发布者: CNMO
Meta加速研发超轻薄头显,智能眼镜市场竞争加剧
Meta加速研发超轻薄头显,智能眼镜市场竞争加剧
发表于:2025-06-04 浏览:27 发布者: 网易科技
淘宝闪购日订单数超8000万 日活用户超2亿
淘宝闪购日订单数超8000万 日活用户超2亿
发表于:2025-07-07 浏览:21 发布者: 网易互联网