arxiv arXiv cs.LG · hace 2 h · fuente: hace 11 d · research

Optimización de recompensas no supervisada para modelos de lenguaje de proteínas

Traducido del English → Español

Un nuevo marco permite a los modelos de lenguaje de proteínas generar secuencias de proteínas controlables sin datos etiquetados ni validación de laboratorio húmedo. Utiliza recompensas independientes de la tarea basadas en la incertidumbre del modelo y la consistencia semántica para guiar la generación, con Optimización de Recompensa Suave y Binarizada superando a las líneas base en cobertura y controlabilidad bajo diversas condiciones.

Importancia 3/3 Nueva función frente a los líderes Nuevo entorno de evaluación con diferenciadores arXiv cs.LG OpenAI Google DeepMind Mistral AI Code generation Evaluation & benchmarks Reasoning models

Leer original