1. 模型参数量与数据类型

Qwen-QWQ-32B,参数:模型本身有 320 亿参数。

2. 额外显存开销

实际运行时还需考虑:

3. 实际需求总结

4. 优化建议

示例配置