當前位置：首頁 > 龍界攻略 > DeepSeek第二炸！開源首個用于MoE模型訓練通信庫

DeepSeek第二炸！開源首個用于MoE模型訓練通信庫

來源：龍界游戲網 | 更新：2025-02-27 13:13:28

DeepSeek 的“開源周”活動今日已經來到第二天，今天發布的是首個開源的用于 MoE 模型訓練和推理的 EP 通信庫 ——DeepEP。

DeepSeek第二炸！開源首個用于MoE模型訓練通信庫

官方表示其具備如下特征：

高效優化的全到全通信方式

支持節點內外通信，兼容 NVLink 和 RDMA 技術

提供高吞吐量的內核，提升訓練和推理前期填充效率

提供低延遲內核，優化推理解碼速度

完全支持 FP8 數據格式調度

提供靈活的 GPU 資源管理，支持計算與通信的重疊執行

DeepSeek第二炸！開源首個用于MoE模型訓練通信庫

據介紹，DeepEP 是一款專為混合專家（MoE）和專家并行（EP）設計的通信庫，提供了高吞吐量和低延遲的 all-to-all GPU 內核，常用于 MoE 派發和合并操作。該庫還支持低精度計算，包括 FP8。

為了與 DeepSeek-V3 論文中提出的組限制門控算法兼容，DeepEP 提供了一些針對不對稱帶寬轉發優化的內核，比如將數據從 NVLink 域轉發到 RDMA 域。這些優化的內核能夠提供高吞吐量，適合用于訓練和推理的預填充任務，同時支持 SM（流式多處理器）數量控制。

對于延遲敏感型的推理解碼任務，DeepEP 提供了一套低延遲內核，采用純 RDMA 技術以最大程度減少延遲。此外，該庫還采用了一種基于 Hook 的通信與計算重疊方法，不會占用任何 SM 資源。

相關文章

熱門龍界攻略

熱門龍界教程

推薦

免責聲明：本網站的所有信息均來自于互聯網收集，侵刪[email protected] 站點地圖

CopyRight©2025 龍界游戲網滬ICP備17046661號-1

99青草视频在线播放视