← 戻る github vLLM · 4日前 · inference v0.24.0 翻訳元 English → 日本語 v0.24.0 リリースには、MoE リファクタリングの Qwen3 NVFP4 構成に対する GSM8K の起動タイムアウトを引き上げるための継続的インテグレーションの更新が含まれています。 重要度 0/3 信頼度 2/3 vLLM 原文を読む