ユーザーがvLLM向けにOrnith 35B FP8 E4M3にMTPを graft する

あるユーザーは、Multi-Token Prediction (MTP) ドラフターサポートを統合することで、ローカルエージェント型コーディングモデル Ornith 35B FP8 E4M3 の修正版を作成し、vLLM とのアウト・オブ・ザ・ボックス互換性の欠如に対処しました。

この修正により、ハイエンドのローカルハードウェアで Ornith 35B を実行するユーザー向けに、パフォーマンス最適化された推論オプションが提供されます。