Todos los artículos
media r/LocalLLaMA · hace 1 d

Notas sobre FastContext de Microsoft y un pequeño experimento de SWE-QA con pistas de recuperación

El autor analiza el artículo de Microsoft sobre FastContext y presenta un enfoque alternativo que utiliza búsqueda semántica fuera de línea para reducir el uso de tokens en agentes de codificación. Al indexar los repositorios por adelantado y proporcionar pistas de rango de archivos a Claude Code, el método logró una reducción del 43,8% en el total de tokens mientras mantenía una calidad de solución equivalente en SWE-QA.

arxiv arXiv cs.CL · hace 1 d

OLIVE: Predicción de latentes aumentados por vista con reconstrucción de forma de onda para SSL de habla

Los autores proponen OLIVE, un marco de aprendizaje de representaciones de habla auto-supervisado que optimiza conjuntamente objetivos de análisis y síntesis mediante predicción de latentes enmascarados aumentados por vista y reconstrucción de forma de onda. Este enfoque unificado restringe las características tempranas del codificador para retener información a nivel de señal, mientras moldea las representaciones contextuales posteriores hacia la invarianza para un rendimiento robusto en tareas posteriores.

arxiv arXiv cs.CL · hace 1 d

MaDI-Bench: Un Benchmark de Integración de Datos de Extremo a Extremo

El Benchmark de Integración de Datos de Mannheim (MaDI-Bench) se presenta como el primer benchmark público para la integración de extremo a extremo de tablas relacionales, abordando la falta de herramientas de evaluación integrales en el campo. Cubre todos los pasos del proceso de integración, incluido el emparejamiento de esquemas, la normalización de valores, el bloqueo de entidades, el emparejamiento de entidades y la fusión de datos.

arxiv arXiv cs.CL · hace 1 d

Descubriendo la dinámica impulsada por la saliencia en la confianza del consumidor con simulación social generativa

Este artículo presenta ConsumerSim, un marco generativo que reconstruye la dinámica del Índice de Confianza del Consumidor (CCI) utilizando una población sintética calibrada con microdatos y diversas señales económicas. El modelo se ubica en el primer lugar entre las líneas base para la precisión de la reconstrucción en las series CCI de EE. UU., la UE27 y Japón, particularmente durante choques de alta saliencia.

arxiv arXiv cs.CL · hace 1 d

MOPD: Distilación On-Policy de Multi-Maestro para la Integración de Capacidades en el Post-Entrenamiento de LLM

Los autores proponen la Distilación On-Policy de Multi-Maestro (MOPD), un paradigma de post-entrenamiento diseñado para integrar las capacidades de múltiples maestros de aprendizaje por refuerzo específicos del dominio en un único modelo estudiante. Este enfoque elimina el sesgo de exposición y proporciona una señal de optimización densa al destilar a los maestros en el estudiante durante sus propias ejecuciones.

arxiv arXiv cs.CL · hace 1 d

RAPS-DA: Especialización por pares consciente del régimen para RAG robusto

Los autores proponen RAPS-DA, un marco de especialización por pares consciente del régimen diseñado para abordar la fragilidad de la generación aumentada con recuperación (RAG) cuando el contexto recuperado entra en conflicto con el conocimiento paramétrico del modelo. Este enfoque desentraña las señales de aprendizaje incompatibles entre diferentes regímenes de confiabilidad mediante el entrenamiento de pares especializados y la aplicación de supervisión dirigida.