Todos los artículos
arxiv arXiv cs.CL · hace 7 h

Enfoque híbrido de árbol de pensamientos para la resumición de fallos de casos legales

Este estudio propone un nuevo enfoque de resumición extractiva-abstracta inspirado en el árbol de pensamientos para los fallos de casos legales, abordando la limitada exploración de técnicas híbridas en trabajos previos. Los experimentos que comparan los modelos DeepSeek y LLaMA demuestran que este método propuesto produce resúmenes superiores en comparación con los prompts extractivos o abstractos tradicionales.

arxiv arXiv cs.CL · hace 7 h

DG^VoiC: Agrupación de hablantes para la investigación de fraude bajo condiciones reales de centro de llamadas

Este artículo presenta DG^VoiC, un marco de agrupación de voz diseñado para identificar hablantes repetidos en audio real de centros de llamadas anonimizado, con el fin de asistir en la investigación de fraude. El método combina anonimización alineada con información sensible, preprocesamiento centrado en el habla, extracción de incrustaciones de hablante mediante ventana deslizante y agrupación basada en similitud coseno.

arxiv arXiv cs.CL · hace 7 h

MultiHashFormer: Modelos de Lenguaje Generativos Basados en Hash

El artículo presenta MultiHashFormer, un marco que permite la autoregresión basada en hash en modelos de lenguaje causales representando tokens como firmas únicas de IDs de hash discretos. Este enfoque permite al modelo comprimir la información del token en vectores latentes para su procesamiento por el Transformer, mientras los mapea de vuelta al texto, abordando efectivamente los problemas de colisión muchos-a-uno que anteriormente impedían el uso de hashing en contextos generativos.

arxiv arXiv cs.CL · hace 7 h

Fusión de datos con verdad única y múltiple utilizando modelos de lenguaje grandes

Este artículo investiga el uso de Modelos de Lenguaje Grandes (LLMs) para tareas de fusión de datos que involucran datos tabulares, cubriendo tanto escenarios de verdad única como de verdad múltiple. El estudio evalúa varias estrategias de prompting en tres conjuntos de datos de referencia para determinar su efectividad al resolver valores conflictivos provenientes de múltiples fuentes.

arxiv arXiv cs.CL · hace 8 h

Límite de escala del Modelo de Lenguaje Aleatorio

Este artículo desarrolla una teoría cuantitativa para el Modelo de Lenguaje Aleatorio (RLM) en un límite de escala donde el número de símbolos ocultos se aproxima al infinito mientras la temperatura de la gramática se aproxima a cero a una relación fija. El estudio establece que el modelo admite una descripción controlada basada en un principio de grandes desviaciones sobre patrones de uso de reglas, mapeando el problema a Modelos de Energía Aleatoria con combinatorias no triviales.

arxiv arXiv cs.CL · hace 8 h

Monitores basados en mecanismos para la detección preventiva de inestabilidad en el entrenamiento de LLM

Este artículo introduce monitores basados en mecanismos diseñados para detectar la inestabilidad del entrenamiento de modelos de lenguaje grandes antes de que cause daños significativos. Al derivar señales internas a partir de los roles funcionales de módulos críticos, estos monitores identifican fallos miles de pasos antes que los métodos tradicionales basados en pérdida.

arxiv arXiv cs.CL · hace 8 h

De tokens a estados: los LLM como un caso especial de modelos del mundo

El artículo desafía la dicotomía entre los grandes modelos de lenguaje y los modelos del mundo al argumentar que los LLM son en realidad un caso especial degenerado de modelos del mundo, en lugar de un reemplazo. Plantea que existe un espectro continuo desde la predicción del siguiente token hasta las arquitecturas de espacio latente, con la investigación actual ocupando ya posiciones intermedias.

arxiv arXiv cs.CL · hace 8 h

Epi2Diff: Usar trazas de razonamiento de LLM para predecir la dificultad de los ítems humanos

Los investigadores presentan Epi2Diff, un marco que mapea las trazas de Modelos de Razonamiento Grande (LRM) en secuencias de episodios fundamentadas cognitivamente para predecir la dificultad de los ítems humanos en evaluación educativa. Al modelar la dificultad a través de la escala de razonamiento, la asignación de esfuerzo y las transiciones de estado, el método proporciona una alternativa interpretable a la costosa calibración humana.

arxiv arXiv cs.CL · hace 8 h

HPRO: Optimización jerárquica progresiva de recompensas para TTS emocional

Los autores proponen HPRO, un marco de optimización jerárquica progresiva de recompensas diseñado para mejorar la expresividad emocional en modelos de Texto-a-Voz basados en LLM mientras se preserva la inteligibilidad lingüística. Este enfoque aborda las discrepancias estructurales en los métodos existentes basados en preferencias al aislar el contenido y la emoción, y cerrar la brecha entre las recompensas dispersas y la generación densa.

arxiv arXiv cs.CL · hace 8 h

Vision-Default, Prior-Override: Mecanismos causales del conflicto entre percepción y conocimiento en modelos de visión-lenguaje

Este estudio investiga cómo los modelos de visión-lenguaje resuelven conflictos entre evidencia visual y conocimiento mundial memorizado combinando parcheo de activación con análisis mecanicista a través de tres familias de modelos. La investigación identifica un circuito causal disperso donde el anclaje visual es el predeterminado, mientras que sobrescribirlo con conocimiento previo requiere cabezales de atención específicos.

arxiv arXiv cs.CL · hace 8 h

Google presenta la herramienta Paper Assistant para revisión científica automatizada

Para abordar los desafíos de escalabilidad de la revisión por pares tradicional en la era de la ciencia asistida por IA, los investigadores proponen una taxonomía de colaboración entre IA y humanos e introducen la herramienta Paper Assistant (PAT). PAT es un marco de IA agente diseñado para ingerir manuscritos científicos completos y producir evaluaciones exhaustivas verificando resultados teóricos, validando experimentos e identificando posibles fallas.

arxiv arXiv cs.LG · hace 9 h

Estimación sin simulación de flujos de tráfico a partir de datos de conteo dispersos

Los autores proponen un método para estimar patrones de flujo de tráfico variables en el tiempo a partir de conteos agregados dispersos de vehículos, dividiendo el área de estudio y resolviendo un problema de optimización de mínimos cuadrados ponderados. Este enfoque utiliza una matriz de contribución ponderada para codificar la cobertura del sensor, dirigiendo el optimizador hacia configuraciones de flujo que son directamente observables.

arxiv arXiv cs.LG · hace 9 h

VeriEvol: Escalar el razonamiento matemático multimodal mediante Verifiable Evol-Instruct

VeriEvol es un marco iterativo diseñado para escalar el razonamiento matemático multimodal desacoplando la dificultad del prompt de la fiabilidad de la respuesta durante la construcción de datos. Emplea un módulo de evolución consciente del tipo para generar prompts más difíciles y el verificador HTV-Agent para garantizar la corrección de las respuestas mediante contraevidencia multi-fuente.

arxiv arXiv cs.LG · hace 9 h

SuperCond-GNN: Modelo sustituto de red neuronal gráfica escalable para simulaciones de circuitos superconductores

Este artículo presenta SuperCond-GNN, un modelo sustituto de red neuronal gráfica diseñado para predecir la distribución de voltaje en imanes superconductores de alta temperatura mediante el mapeo de circuitos de elementos concentrados a representaciones gráficas. El modelo logra un MAPE medio del 4.3% en apilamientos de cintas y permite una inferencia rápida de la redistribución de corriente en diversas configuraciones de circuitos.