DeepSeek-V3.2-Exp模型正式發布並開源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
最新快訊
OKX CEO Star:OKX 堅持合規,不會人為製造代幣或拉盤造勢
ChainCatcher
2025-10-09 08:35:54
數據:某巨鯨再次向幣安轉入 610 萬枚 ASTER,價值約 1207 萬美元
ChainCatcher
2025-10-09 08:34:42
中信證券:美聯儲降息路徑仍存不確定性
ChainCatcher
2025-10-09 08:28:41
Bitwise設定Solana質押ETF費率為 0.2%,低於市場預期
ChainCatcher
2025-10-09 08:24:44
數據:ETH 當前全網 8 小時平均資金費率為 0.0052%
ChainCatcher
2025-10-09 08:17:06