Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 115

Aprendizaje de Modelado de Acciones Complementarias a partir de Instrucciones de Mantenimiento Automotriz

El artículo introduce el Modelado de Acciones Complementarias (CAM), una tarea centrada en identificar o generar contrapartes procedimentales en instrucciones de mantenimiento automotriz modificando únicamente la frase de acción mientras se preserva el contexto restante de la oración.

arxiv arXiv cs.CL · hace 10 h

Lobo de Tres Cabezas: Un Rol de Bufón para la Teoría de la Mente Multi-salto en LLMs

Los investigadores ampliaron el juego del Lobo con un rol de Bufón para crear un entorno de deducción social triádico que requiere razonamiento a través de tres funciones de utilidad opuestas, desafiando las capacidades de teoría de la mente de los modelos de lenguaje grandes. Las evaluaciones en GPT-4.1, DeepSeek-V3.1 y Llama-3.3-70B revelaron que, aunque el Bufón ganó el 60-70% de las partidas, los lobos de GPT-4.1 votaron frecuentemente para expulsar al Bufón en el día 1 en el 60-70% de los casos, una acción autodestructiva impulsada por priores lingüísticos.

arxiv arXiv cs.CL · hace 10 h

Resolución de problemas geométricos verificables: Autoformalización y propuesta de teoremas impulsadas por el solver

Los investigadores proponen SD-GPS, un framework impulsado por el solver para la resolución de problemas geométricos que aborda los cuellos de botella en la autoformalización y la predicción de teoremas tratando al solver simbólico como un oráculo de ejecución. Este enfoque unifica la adaptación supervisada del lenguaje formal con el aprendizaje por refuerzo guiado por la solvabilidad para garantizar la ejecutabilidad durante la formalización.

arxiv arXiv cs.CL · hace 10 h

VASAE: Nombrar direcciones del diccionario SAE con anclaje alineado al vocabulario

Los autores presentan el Autoencoder Disparo Alineado al Vocabulario (VASAE), un método que entrena características de autoencoder disparo utilizando anclaje alineado al vocabulario para asignar a cada característica un nombre de token intrínseco basado en la incrustación más cercana en el vocabulario del Transformer.

arxiv arXiv cs.CL · hace 10 h

Marco persuasivo de IA en dilemas colectivos

Un estudio con 1.283 participantes evaluó si los asistentes de IA podían mejorar la cooperación en Juegos de Riesgo Colectivo iterados mediante un marco persuasivo personalizado basado en perfiles de Orientación del Valor Social. La investigación encontró que, aunque las señales pro-sociales aumentaron significativamente las contribuciones y las tasas de éxito del grupo, estos efectos fueron de corta duración.

Aprendizaje de Modelado de Acciones Complementarias a partir de Instrucciones de Mantenimiento Automotriz

Lobo de Tres Cabezas: Un Rol de Bufón para la Teoría de la Mente Multi-salto en LLMs

Resolución de problemas geométricos verificables: Autoformalización y propuesta de teoremas impulsadas por el solver

VASAE: Nombrar direcciones del diccionario SAE con anclaje alineado al vocabulario

Marco persuasivo de IA en dilemas colectivos

Un análisis empírico de errores factuales en textos escritos por humanos y su aplicación

Marco Explicable Multi-etapa para la Detección de Trastornos Cognitivos Basada en Voz

ToxiREX: Un conjunto de datos sobre razonamiento tóxico en contexto

De diálogo a detección: una canalización híbrida multimodal de PLN para la detección de fraude en seguros

La matriz de cobertura de señales: estratificación de errores de tipo y semánticos en la autoformalización de enunciados

Enfoque híbrido de árbol de pensamientos para la resumición de fallos de casos legales

DG^VoiC: Agrupación de hablantes para la investigación de fraude bajo condiciones reales de centro de llamadas

Los LLMs juzgan peor de lo que generan en QA con contexto

MultiHashFormer: Modelos de Lenguaje Generativos Basados en Hash

Fusión de datos con verdad única y múltiple utilizando modelos de lenguaje grandes

Límite de escala del Modelo de Lenguaje Aleatorio

Monitores basados en mecanismos para la detección preventiva de inestabilidad en el entrenamiento de LLM

De tokens a estados: los LLM como un caso especial de modelos del mundo

Epi2Diff: Usar trazas de razonamiento de LLM para predecir la dificultad de los ítems humanos

HPRO: Optimización jerárquica progresiva de recompensas para TTS emocional