arxiv arXiv cs.LG · hace 2 h · fuente: hace 10 d · research

Control jerárquico basado en LLM en juegos multiagente

Traducido del English → Español

Un sistema jerárquico que utiliza un LLM preentrenado para seleccionar políticas de habilidades de RL supera al RL plano en un entorno King of the Hill 2v2. Igualua el rendimiento de los árboles de comportamiento diseñados a mano en tasa de victoria y es percibido como más humano por el 60% de los usuarios, destacando una coordinación efectiva y adaptabilidad sin diseño manual de reglas.

Importancia 3/3 Nueva función frente a los líderes Nuevo entorno de evaluación con diferenciadores arXiv cs.LG OpenAI Google DeepMind Meta AI AI agents Reasoning models Training methods

Leer original