← 뒤로 github vLLM · 4일 전 · inference v0.24.0 번역 English → 한국어 v0.24.0 릴리스에는 MoE 리팩토링 Qwen3 NVFP4 구성에 대한 GSM8K 시작 시간 초과를 늘리기 위한 지속적인 통합 업데이트가 포함됩니다. 중요도 0/3 신뢰도 2/3 vLLM 원문 보기