사용자가 vLLM을 위해 Ornith 35B FP8 E4M3에 MTP를 graft함

한 사용자가 Multi-Token Prediction (MTP) drafter 지원을 통합하여 로컬 에이전틱 코딩 모델 Ornith 35B FP8 E4M3의 수정된 버전을 생성했으며, 이는 vLLM과의 기본 호환성 부재를 해결합니다.

이 수정은 하이엔드 로컬 하드웨어에서 Ornith 35B를 실행하는 사용자에게 성능 최적화된 추론 옵션을 제공합니다.