🍊 Latent Atlas 🍉

Home

❯

Sources

❯

Papers

❯

Grouped Query Attention

Grouped-Query Attention

2026年6月01日1分钟阅读

  • source
  • paper
  • attention
  • gqa
  • kv-cache

基本信息

  • Title: GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints
  • Source type: paper
  • Related topic notes: Grouped-Query Attention, Multi-Query Attention, KV Cache

TODO

  • 阅读论文原文,整理 GQA 如何在 MHA 和 MQA 之间折中 KV heads 数量。
  • 回填从 MHA checkpoint 转换/训练 GQA 模型的思路。
  • 梳理 GQA 对 KV Cache、memory bandwidth 和质量的影响。

关系图谱

  • 基本信息
  • TODO

反向链接

  • Attention
  • Grouped-Query Attention
  • Attention
  • Multi-Query Attention
  • Papers

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026