← 返回 github vLLM · 4 天前 · inference v0.24.0 译自 English → 中文 v0.24.0 版本更新包括一项持续集成更改,旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。 重要性 0/3 可信度 2/3 vLLM 阅读原文