Se presenta TROPT como el primer marco de código abierto que unifica la optimización de disparadores de texto discreto, estandarizando la ejecución y el desarrollo bajo una única interfaz. Aborda la fragmentación actual permitiendo a los usuarios personalizar recetas de optimización de extremo a extremo mediante modelos, objetivos y optimizadores intercambiables.
- TROPT proporciona más de 30 recetas de optimización construidas con más de 15 optimizadores (que abarcan acceso de caja blanca a caja negra) y más de 15 funciones de pérdida.
- El marco permite la comparación fácil de variantes de optimizadores y estrategias de portabilidad en dominios como el jailbreaking de LLM y el envenenamiento de corpus.
- Experimentos a gran escala utilizando TROPT revelaron técnicas potentes pero poco adoptadas para optimizar jailbreaks de LLM.
TROPT reduce significativamente la barrera para adoptar y avanzar en la optimización de texto discreto, facilitando una investigación más amplia en pruebas de penetración de modelos, auditorías e interpretabilidad.