El Sistema de Compañeros utiliza un monitor de entropía en Rust para detectar la incertidumbre por token en la inferencia local de Gemma 3 4B, enrutando solo los tokens inciertos a Sonnet mediante extracción de fragmentos controlada por NER y recuperación semántica. Los benchmarks muestran que logra una precisión del 71,4 % a $0,21, superando al patrón Anthropic Advisor (62,9 % a $0,44) en siete conjuntos de datos de Hugging Face, con una mejora clave en SQuAD v2 al enrutar fragmentos del pasaje fuente al modelo en la nube.