Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 1 / 79

arxiv arXiv cs.LG · hace 1 h En vivo

SCBoost: Reducir la redundancia del aprendiz mediante ortogonalización residual

SCBoost introduce la ortogonalización residual para eliminar la redundancia del aprendiz en el boosting. Utiliza Proyección Residual Espectral y Ponderación Regularizada por Covarianza para asegurar que cada aprendiz capture componentes de error novedosos y reduzca las correlaciones del conjunto. El análisis teórico y los experimentos muestran una mejora en la precisión y las puntuaciones F1 en diez conjuntos de datos de referencia.

arxiv arXiv cs.LG · hace 1 h En vivo

Credit-in-Event: Reanclando el crédito del evento en modelos de dinámica

Un nuevo método llamado Credit-in-Event identifica y aborda la dilución temporal del crédito en modelos de dinámica aprendidos. CREST, una lectura sin etiquetas y sin entrenamiento, reancla las representaciones agrupadas estimando los núcleos transitorios de los eventos y aplicando contraste entre evento y resto, reduciendo el error fuera de distribución en múltiples sistemas y tipos de datos. Las ablativos confirman que la mejora proviene del reanclaje del crédito del núcleo del evento, no de priores genéricos de localidad o estabilidad.

arxiv arXiv cs.LG · hace 1 h En vivo

Las características de LLM pueden perjudicar a los GNNs mediante interferencia por concatenación

Concatenar características generadas por LLM a redes neuronales gráficas reduce sistemáticamente la precisión en benchmarks homofílicos, con una caída de la precisión en PubMed de -17.0 +/- 0.3 pp. Una medida de discriminabilidad solo de LLM, Delta_sig, se correlaciona fuertemente con el rendimiento por concatenación (r^2 = 0.38), y una regla basada en Delta_sig <= 13.8 pp predice correctamente un impacto no positivo en 7 de cada 9 conjuntos de datos.

arxiv arXiv cs.LG · hace 1 h En vivo

SelFix: Inversión de punto fijo con selección de raíz para flujos rectificados mediante la linealidad de trayectorias

SelFix mejora la inversión de punto fijo seleccionando soluciones que producen trayectorias inversas más rectas, mejorando la reconstrucción de imágenes reales y la edición que preserva la fuente. Los experimentos en FLUX.1-dev y PIE-Bench muestran que supera a las líneas base anteriores tanto en calidad de reconstrucción como en fidelidad de edición.

arxiv arXiv cs.LG · hace 1 h En vivo

SPHERE-JEPA: Familia de Regularizadores Estadísticos para la Hiperesfera

SPHERE-JEPA introduce regularizadores estadísticos deterministas en la hiperesfera, reemplazando métodos estocásticos segmentados con objetivos integrados analíticamente como MMD, KSD y divergencia KL. Los núcleos invariantes por rotación basados en filtros de calor y limitados en banda garantizan un aprendizaje libre de sesgo espacial, con resultados empíricos que muestran una convergencia y rendimiento mejorados en ImageNet y Galaxy10, y una separación de instancias superior en la recuperación de texturas procedimentales utilizando divergencia KL.

arxiv arXiv cs.LG · hace 1 h En vivo

SkillMigrator: Patrones de interacción transferibles para la eficiencia de agentes web

SkillMigrator aprende habilidades web reutilizables al emparejar estructuras de diseño en lugar de referencias a elementos. Almacena cada habilidad como un patrón de interacción transferible con un boceto estructural, lo que permite una transferencia eficiente de habilidades entre sitios. En comparación con los métodos más avanzados, reduce el recuento promedio de acciones del LLM en un 8-10% en WebArena y Mind2Web a tasas de éxito equivalentes.

media r/LocalLLaMA · hace 1 h En vivo

Qwen3-VL-2B destaca en la extracción de JSON en hardware de gama baja

Un usuario informa que Qwen3-VL-2B es el único modelo viable de visión y lenguaje para extraer datos de imágenes a JSON de forma fiable en dispositivos con especificaciones bajas, como portátiles Intel i3 con 8GB de RAM. El autor señala que, a pesar de su rendimiento, el modelo está ausente de las principales evaluaciones como Artificial Analysis y la Open LLM Leaderboard.

arxiv arXiv cs.LG · hace 1 h En vivo

Marco de descomposición de riesgos para la predicción del ajuste fino previo

Un nuevo marco descompone el riesgo de predicción del ajuste fino previo en límites intrínsecos y varianza de optimización. Demuestra un límite inferior necesario para el decaimiento de la varianza e introduce una estrategia de sondeo óptima en términos de presupuesto, validada a través de benchmarks sintéticos y del mundo real mediante tres regímenes de predicción distintos.

arxiv arXiv cs.LG · hace 1 h En vivo

Las redes neuronales con restricciones físicas mejoran la predicción del clima

Un estudio mejora las redes neuronales con restricciones físicas mediante la introducción de un solucionador numérico actualizado, un bloque autoregresivo unificado y dos arquitecturas de red neuronal. Estas mejoras reducen el error cuadrático medio en un 8-22% en pronósticos a corto plazo sobre el Pacífico Sur y preservan mejor la consistencia física.

arxiv arXiv cs.LG · hace 1 h En vivo

TUNEAHEAD Predice el Rendimiento del Ajuste Fino Antes del Entrenamiento

TUNEAHEAD es un marco ligero que predice el rendimiento del ajuste fino utilizando vectores de metacaracterísticas a partir de descriptores de conjuntos de datos y ejecuciones de prueba cortas. Supera a las líneas base como la Extrapolación de Parada Temprana y ProxyLM, logrando una RMSE de 1.47 puntos porcentuales y el 95.1% de las predicciones dentro de ±3 puntos porcentuales de los puntajes verdaderos en 370 ejecuciones retenidas.

arxiv arXiv cs.LG · hace 1 h En vivo

Parches de grafos aprendibles para la heterogeneidad de características

Proponemos parches de grafos aprendibles como las unidades semánticas más pequeñas en datos de grafos para abordar la heterogeneidad de características sin información textual. Nuestro marco utiliza codificadores y agregadores de parches para extraer y combinar conocimiento entre dominios, permitiendo el preentrenamiento universal y un mejor rendimiento en tareas posteriores con más datos de preentrenamiento.

arxiv arXiv cs.LG · hace 1 h En vivo

ASTEROID: Transformer para Pronóstico de MD Multietapa

ASTEROID es un marco impulsado por datos que predice coordenadas atómicas multietapa en simulaciones de dinámica molecular sin integración iterativa. Utiliza una arquitectura Transformer espaciotemporal para modelar dependencias multiescala, logrando mayor precisión y menor costo computacional en comparación con métodos existentes en conjuntos de datos derivados de mecánica cuántica.

arxiv arXiv cs.LG · hace 1 h En vivo

EnvRL: Aprovechando la Dinámica del Entorno en RL Agéntico

EnvRL introduce un marco que mejora el aprendizaje por refuerzo agéntico incorporando la dinámica del entorno a través de objetivos de predicción de estado y dinámica inversa. Al entrenarse con GRPO, EnvRL mejora las tasas de éxito de Qwen-2.5-1.5B-Instruct de 72.8% a 77.4% en ALFWorld y de 56.8% a 67.0% en WebShop.

arxiv arXiv cs.LG · hace 1 h En vivo

Equidad en Redes Neuronales Gráficas mediante Adaptación Laplaciana

Un nuevo marco modifica el operador Laplaciano en la difusión de grafos para mejorar la equidad incorporando proyecciones de subespacio, ajustes espectrales y filtrado basado en frecuencia. El método aprovecha las propiedades de suavizado de la difusión de grafos para mitigar el sesgo, con análisis teórico y validación empírica en conjuntos de datos sintéticos y del mundo real que muestran una equidad mejorada sin sobrecarga computacional significativa.

arxiv arXiv cs.LG · hace 1 h En vivo

La reformulación de objetivos basada en delta mejora la predicción de carga eléctrica

Una reformulación de objetivos basada en delta mejora la predicción de carga eléctrica a corto plazo al predecir cambios en la carga en lugar de valores absolutos. Los resultados muestran una reducción del MAPE superior al 50% para las predicciones con una hora de antelación en modelos LSTM y Transformer, con beneficios significativos para los modelos de secuencia profunda en las predicciones con un día de antelación.

arxiv arXiv cs.LG · hace 1 h En vivo

Marco de Aprendizaje Curricular de Profesor de Transferencia Consciente de Confusión

Se introduce una puntuación de dificultad consciente de confusión dentro del marco de Profesor de Transferencia para mejorar la interpretabilidad del modelo y la eficiencia de los datos. Las evaluaciones en CIFAR-10 muestran que el ordenamiento curricular consciente de confusión supera al ordenamiento aleatorio hasta un 8,7% con el 20% de los datos, demostrando ganancias consistentes en la eficiencia de los datos. Sin embargo, el ordenamiento curricular o anticurricular no mejora la precisión sobre el entrenamiento estándar con todos los datos, lo que indica que las mejoras en la función de puntuación por sí solas son insuficientes para superar los modos de fallo del aprendizaje curricular.

arxiv arXiv cs.LG · hace 1 h En vivo

Los modelos de visión y lenguaje no siempre necesitan imágenes para la precisión en radiografías de tórax

Una auditoría causal muestra que muchos modelos de visión y lenguaje logran alta precisión en radiografías de tórax sin usar imágenes. Los modelos solo de texto igualan a los modelos multimodales en rendimiento y los superan en fundamentación, con indicadores de precisión y confianza que solo aparecen cuando se usa la imagen. Estos hallazgos sugieren que la precisión por sí sola es insuficiente para validar el despliegue clínico, y debe evaluarse la fundamentación.

arxiv arXiv cs.LG · hace 1 h En vivo

SMAA-Fair: Una extensión consciente de la equidad de SMAA para el ranking

SMAA-Fair extiende el Análisis de Aceptabilidad Multicriterio Estocástico mediante el reponderamiento de los rankings basándose en la equidad grupal. Incorpora métricas de equidad como Paridad Estadística, rKL y nDKL, ajustando los índices de aceptabilidad para representar mejor a los grupos protegidos mientras se mantiene la robustez ante la incertidumbre de las preferencias.

arxiv arXiv cs.LG · hace 1 h En vivo

Recuperación ciega de dominios latentes mediante descubrimiento no supervisado de simetrías

El artículo propone un marco no supervisado para recuperar dominios y señales latentes a partir de observaciones corruptas, descubriendo las simetrías de los datos. Modela las observaciones como mediciones lineales de señales procedentes de un campo aleatorio latente y utiliza una red convolucional de grupo superficial con restricciones de estacionariedad y localidad para aprender las acciones y filtros de simetría latente, lo que permite la recuperación a partir de datos no estructurados.

arxiv arXiv cs.LG · hace 1 h En vivo

Memorias latentes ligeras y experienciales para la mejora continua

Un nuevo método permite que los modelos de lenguaje grandes aprendan de sus propias trazas de razonamiento sin supervisión externa. Al destilar el cómputo del tiempo de inferencia en memorias latentes ligeras y modulares, el modelo logra un rendimiento competitivo con el entrenamiento completo y supera las líneas base de cero disparos y ICL crudo en tareas de razonamiento matemático, con una sobrecarga computacional mínima.