Este artículo desarrolla una teoría para regímenes de descodificación especulativa que utilizan descodificación codiciosa (greedy), reglas de aceptación relajadas o conjuntos de candidatos basados en árboles, en lugar de los entornos estocásticos que preservan la distribución estudiados en la literatura existente. Los autores caracterizan las regiones de rechazo como conjuntos de nivel inferior de la distribución objetivo para derivar requisitos exactos de divergencia KL y cotas precisas basadas en márgenes para varios criterios de aceptación.

  • Caracteriza certificados exactos y cotas basadas en márgenes para descodificación codiciosa estricta, aceptación relajada aditiva y multiplicativa, criterios relajados top-(m) y aceptación con umbral de entropía.
  • Extiende el marco a la descodificación codiciosa basada en árboles, derivando certificados exactos y solo basados en márgenes para cuándo el token codicioso objetivo sigue siendo cubierto por los candidatos top-(m) del creador (drafter).
  • Evalúa estos certificados en modelos Qwen3, mostrando que los criterios relajados y basados en árboles amplían sustancialmente la región de aceptación certificada, particularmente durante los pasos con un margen bajo en la distribución del modelo objetivo.

Estos resultados complementan los análisis existentes de preservación de distribución al caracterizar los eventos locales de aceptación determinista comunes en sistemas de inferencia prácticos.