🍊 Latent Atlas 🍉

Home

❯

Sources

❯

Papers

❯

DeepSeekMoE

DeepSeekMoE

2026年6月01日1分钟阅读

  • source
  • paper
  • moe
  • deepseek

基本信息

  • Title: DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models
  • Source type: paper
  • Related topic notes: Mixture of Experts, DeepSeek

TODO

  • 阅读论文原文,整理 fine-grained expert segmentation、shared experts 和 expert specialization 的设计动机。
  • 回填 DeepSeekMoE 与经典 sparsely-gated MoE、Switch Transformer 的差异。
  • 补充 MoE 中 shared/routed experts、负载均衡和专家 specialization 的稳定知识。

关系图谱

  • 基本信息
  • TODO

反向链接

  • Sparse and Efficient Architectures
  • Mixture of Experts
  • Papers

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026