CEAP reduce la varianza en el descubrimiento de circuitos de LLM

CEAP, un nuevo método de descubrimiento de circuitos, reduce sustancialmente la varianza de remuestreo en comparación con EAP-IG. El artículo muestra que la varianza por reformulación surge porque las plantillas de prompt activan diferentes circuitos, lo que sugiere que los LLM son inherentemente difíciles de dirigir a través de entradas diversas. La varianza por muestra es en gran medida benigna, ya que los puntajes bajos de fidelidad se deben al escalado selectivo de contribuciones, no a defectos del circuito.