极致压榨 96G 显存:Qwen3.5 122B (MoE) 大模型本地部署优化指南
极致压榨 96G 显存:Qwen3.5 122B (MoE) 大模型本地部署优化指南在本地运行超大规模模型(如 Qwen3.5 122B A10B)时,硬件性能的充分发挥往往取决于细微的参数配置。本文将针对 AMD 395max(128G 内存,其中 96G 分配为显存)这一典型硬件环境,分享如何解决主机内存溢出(OOM)、显存利用率不足以及模型崩溃等...
FreeX Hub 是一个专注于技术分享、开发者工具、云原生、AI 工程化、VPS 测评、教育邮箱资源与互联网实用福利的开放平台。提供可复现的教程、实测评测、部署指南与实用工具,帮助开发者与技术爱好者高效探索无限可能。