AI知识中心 / 学习路线 / LLM 部署与推理 / GPTQ 与 AWQ:大模型量化技术详解
📚LLM 部署与推理·1/3
33% 完成
📖 教程高级⏱️ 16 分钟

GPTQ 与 AWQ:大模型量化技术详解

📅 2026/5/14✍️ 佚名💬 0 条评论

为什么需要量化?FP16 14GB → INT4 4GB


GPTQ · AWQ · GGUF


4-bit 下性能损失 < 1%,部署必学技能。

评论 (0)

请先登录后发表评论

暂无评论,来发表第一条评论吧