Esta versão candidata corrige a funcionalidade de Prefill/Decode (P/D) em conjunto com o Supervisor de Paralelismo de Dados (DP) no projeto vLLM.
- A atualização resolve problemas relacionados à interação entre o agendamento P/D e o Supervisor DP.
- Esta alteração foi extraída do commit c5e3c40877c2b6d0e16d534641b39fe6744979b7.