O Sistema Buddy usa um monitor de entropia Rust para detectar a incerteza por token na inferência local do Gemma 3 4B, roteando apenas tokens incertos para o Sonnet por meio de extração de span com gate NER e recuperação semântica. Os benchmarks mostram que ele alcança 71,4% de precisão por $0,21, superando o padrão Anthropic Advisor (62,9% por $0,44) em sete conjuntos de dados do Hugging Face, com uma melhoria chave no SQuAD v2 ao rotear trechos de passagem de origem para o modelo na nuvem.