开发者与开源 重要度 2

大MoE量化内存规划求助

Reddit 用户计划未来搭建 256GB 或 512GB DRAM 加 48GB VRAM 的本地推理机器,提前下载大 MoE 模型并选择合适量化版本。帖子重点询问 GLM-5.2 等模型在 Q2/Q3/Q4 量化、未量化 KV 缓存和不同上下文长度下的实际内存占用。

事件进展(1 篇报道)

  1. 2026-07-04 02:21

← 返回首页