IF9.CN 消息,9 月 29 日,DeepSeek-V3.2-Exp 模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。(金十)
DeepSeek-V3.2-Exp模型正式发布并开源
- THE END -
本文由 @决策财经 修订发布于 2025-09-29 18:13:00
本文来自投稿,不代表本站立场,如若转载,请注明出处:/news/live-news/126569
评论 (共 条评论,人围观)
