🍊 Latent Atlas 🍉

Home

❯

Inference

❯

Compression

Compression

2026年4月18日1分钟阅读

Compression 模块负责整理模型压缩方法,包括剪枝、蒸馏、低秩压缩和与推理部署相关的压缩取舍。

Notes

  • 模型压缩
  • Pruning
  • Distillation for Inference
  • Low-rank Compression

此文件夹下有4条笔记。

  • 2026年4月19日

    Distillation for Inference

    • compression
    • distillation
  • 2026年4月19日

    Low-rank Compression

    • compression
    • low-rank
  • 2026年4月19日

    Model Compression

    • inference
    • compression
  • 2026年4月19日

    Pruning

    • compression
    • pruning

🍊 Latent Atlas 🍉 · An AI knowledge atlas built with Quartz © 2026