Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 79

SkillMigrator: Patrones de interacción transferibles para la eficiencia de agentes web

SkillMigrator aprende habilidades web reutilizables al emparejar estructuras de diseño en lugar de referencias a elementos. Almacena cada habilidad como un patrón de interacción transferible con un boceto estructural, lo que permite una transferencia eficiente de habilidades entre sitios. En comparación con los métodos más avanzados, reduce el recuento promedio de acciones del LLM en un 8-10% en WebArena y Mind2Web a tasas de éxito equivalentes.

media r/LocalLLaMA · hace 1 h En vivo

Qwen3-VL-2B destaca en la extracción de JSON en hardware de gama baja

Un usuario informa que Qwen3-VL-2B es el único modelo viable de visión y lenguaje para extraer datos de imágenes a JSON de forma fiable en dispositivos con especificaciones bajas, como portátiles Intel i3 con 8GB de RAM. El autor señala que, a pesar de su rendimiento, el modelo está ausente de las principales evaluaciones como Artificial Analysis y la Open LLM Leaderboard.

arxiv arXiv cs.LG · hace 1 h En vivo

Marco de descomposición de riesgos para la predicción del ajuste fino previo

Un nuevo marco descompone el riesgo de predicción del ajuste fino previo en límites intrínsecos y varianza de optimización. Demuestra un límite inferior necesario para el decaimiento de la varianza e introduce una estrategia de sondeo óptima en términos de presupuesto, validada a través de benchmarks sintéticos y del mundo real mediante tres regímenes de predicción distintos.

arxiv arXiv cs.LG · hace 1 h En vivo

Las redes neuronales con restricciones físicas mejoran la predicción del clima

Un estudio mejora las redes neuronales con restricciones físicas mediante la introducción de un solucionador numérico actualizado, un bloque autoregresivo unificado y dos arquitecturas de red neuronal. Estas mejoras reducen el error cuadrático medio en un 8-22% en pronósticos a corto plazo sobre el Pacífico Sur y preservan mejor la consistencia física.

arxiv arXiv cs.LG · hace 1 h En vivo

TUNEAHEAD Predice el Rendimiento del Ajuste Fino Antes del Entrenamiento

TUNEAHEAD es un marco ligero que predice el rendimiento del ajuste fino utilizando vectores de metacaracterísticas a partir de descriptores de conjuntos de datos y ejecuciones de prueba cortas. Supera a las líneas base como la Extrapolación de Parada Temprana y ProxyLM, logrando una RMSE de 1.47 puntos porcentuales y el 95.1% de las predicciones dentro de ±3 puntos porcentuales de los puntajes verdaderos en 370 ejecuciones retenidas.

arxiv arXiv cs.LG · hace 1 h En vivo

Parches de grafos aprendibles para la heterogeneidad de características

Proponemos parches de grafos aprendibles como las unidades semánticas más pequeñas en datos de grafos para abordar la heterogeneidad de características sin información textual. Nuestro marco utiliza codificadores y agregadores de parches para extraer y combinar conocimiento entre dominios, permitiendo el preentrenamiento universal y un mejor rendimiento en tareas posteriores con más datos de preentrenamiento.

arxiv arXiv cs.LG · hace 1 h En vivo

ASTEROID: Transformer para Pronóstico de MD Multietapa

ASTEROID es un marco impulsado por datos que predice coordenadas atómicas multietapa en simulaciones de dinámica molecular sin integración iterativa. Utiliza una arquitectura Transformer espaciotemporal para modelar dependencias multiescala, logrando mayor precisión y menor costo computacional en comparación con métodos existentes en conjuntos de datos derivados de mecánica cuántica.

arxiv arXiv cs.LG · hace 1 h En vivo

EnvRL: Aprovechando la Dinámica del Entorno en RL Agéntico

EnvRL introduce un marco que mejora el aprendizaje por refuerzo agéntico incorporando la dinámica del entorno a través de objetivos de predicción de estado y dinámica inversa. Al entrenarse con GRPO, EnvRL mejora las tasas de éxito de Qwen-2.5-1.5B-Instruct de 72.8% a 77.4% en ALFWorld y de 56.8% a 67.0% en WebShop.

arxiv arXiv cs.LG · hace 1 h En vivo

Equidad en Redes Neuronales Gráficas mediante Adaptación Laplaciana

Un nuevo marco modifica el operador Laplaciano en la difusión de grafos para mejorar la equidad incorporando proyecciones de subespacio, ajustes espectrales y filtrado basado en frecuencia. El método aprovecha las propiedades de suavizado de la difusión de grafos para mitigar el sesgo, con análisis teórico y validación empírica en conjuntos de datos sintéticos y del mundo real que muestran una equidad mejorada sin sobrecarga computacional significativa.

arxiv arXiv cs.LG · hace 1 h En vivo

La reformulación de objetivos basada en delta mejora la predicción de carga eléctrica

Una reformulación de objetivos basada en delta mejora la predicción de carga eléctrica a corto plazo al predecir cambios en la carga en lugar de valores absolutos. Los resultados muestran una reducción del MAPE superior al 50% para las predicciones con una hora de antelación en modelos LSTM y Transformer, con beneficios significativos para los modelos de secuencia profunda en las predicciones con un día de antelación.

arxiv arXiv cs.LG · hace 1 h En vivo

Marco de Aprendizaje Curricular de Profesor de Transferencia Consciente de Confusión

Se introduce una puntuación de dificultad consciente de confusión dentro del marco de Profesor de Transferencia para mejorar la interpretabilidad del modelo y la eficiencia de los datos. Las evaluaciones en CIFAR-10 muestran que el ordenamiento curricular consciente de confusión supera al ordenamiento aleatorio hasta un 8,7% con el 20% de los datos, demostrando ganancias consistentes en la eficiencia de los datos. Sin embargo, el ordenamiento curricular o anticurricular no mejora la precisión sobre el entrenamiento estándar con todos los datos, lo que indica que las mejoras en la función de puntuación por sí solas son insuficientes para superar los modos de fallo del aprendizaje curricular.

arxiv arXiv cs.LG · hace 2 h

Los modelos de visión y lenguaje no siempre necesitan imágenes para la precisión en radiografías de tórax

Una auditoría causal muestra que muchos modelos de visión y lenguaje logran alta precisión en radiografías de tórax sin usar imágenes. Los modelos solo de texto igualan a los modelos multimodales en rendimiento y los superan en fundamentación, con indicadores de precisión y confianza que solo aparecen cuando se usa la imagen. Estos hallazgos sugieren que la precisión por sí sola es insuficiente para validar el despliegue clínico, y debe evaluarse la fundamentación.

arxiv arXiv cs.LG · hace 2 h

SMAA-Fair: Una extensión consciente de la equidad de SMAA para el ranking

SMAA-Fair extiende el Análisis de Aceptabilidad Multicriterio Estocástico mediante el reponderamiento de los rankings basándose en la equidad grupal. Incorpora métricas de equidad como Paridad Estadística, rKL y nDKL, ajustando los índices de aceptabilidad para representar mejor a los grupos protegidos mientras se mantiene la robustez ante la incertidumbre de las preferencias.

arxiv arXiv cs.LG · hace 2 h

Recuperación ciega de dominios latentes mediante descubrimiento no supervisado de simetrías

El artículo propone un marco no supervisado para recuperar dominios y señales latentes a partir de observaciones corruptas, descubriendo las simetrías de los datos. Modela las observaciones como mediciones lineales de señales procedentes de un campo aleatorio latente y utiliza una red convolucional de grupo superficial con restricciones de estacionariedad y localidad para aprender las acciones y filtros de simetría latente, lo que permite la recuperación a partir de datos no estructurados.

arxiv arXiv cs.LG · hace 2 h

Memorias latentes ligeras y experienciales para la mejora continua

Un nuevo método permite que los modelos de lenguaje grandes aprendan de sus propias trazas de razonamiento sin supervisión externa. Al destilar el cómputo del tiempo de inferencia en memorias latentes ligeras y modulares, el modelo logra un rendimiento competitivo con el entrenamiento completo y supera las líneas base de cero disparos y ICL crudo en tareas de razonamiento matemático, con una sobrecarga computacional mínima.

arxiv arXiv cs.LG · hace 2 h

QueryMarket: Aprendizaje Activo en Línea Sensible al Costo en Mercados de Datos

QueryMarket introduce OVBAL, un marco de aprendizaje activo en línea basado en varianza que estima la utilidad marginal de cada punto de datos utilizando un criterio de D-optimalidad con olvido exponencial. OVBAL selecciona muestras basándose en utilidad y precio, operando bajo restricciones presupuestarias móviles y adaptándose a la deriva conceptual, mostrando mejores compensaciones entre error y costo en tareas de pronóstico de energía solar.

arxiv arXiv cs.LG · hace 2 h

No-Free-Fairness: Límites fundamentales en sistemas de aprendizaje

El artículo introduce teoremas de 'No-Free-Fairness' que demuestran tres límites fundamentales en los sistemas de aprendizaje. Estos incluyen compensaciones inherentes entre equidad y costo, disparidad inevitable entre subgrupos en muestras finitas y restricciones de expresividad del modelo que impiden la equidad independientemente de los datos. Los resultados muestran que la equidad está limitada por la estructura del problema, los límites de los datos y la capacidad del modelo, no solo por datos sesgados.

arxiv arXiv cs.LG · hace 2 h

Leyes de conservación para arquitecturas neuronales modernas

Este artículo presenta un marco unificado para identificar leyes de conservación en el flujo del gradiente para arquitecturas neuronales modernas. Cubre redes feedforward con activaciones GELU, SiLU y SwiGLU, atención multi-cabeza con codificaciones posicionales sinusoidales y rotatorias, y modelos Mixture-of-Experts bajo varios esquemas de gating. Los experimentos validan los invariantes predichos, apoyando los hallazgos teóricos.

arxiv arXiv cs.LG · hace 2 h

Equivalencia funcional en la atención con codificaciones posicionales

Un estudio exhaustivo revela que las codificaciones posicionales sinusoidales preservan la equivalencia funcional en los Transformers, mientras que las codificaciones posicionales rotatorias reducen la simetría, mejorando la expresividad. La investigación muestra que las codificaciones posicionales influyen críticamente en la conectividad de modo lineal, con resultados empíricos que demuestran variabilidad en la conectividad dependiendo de la codificación utilizada.

arxiv arXiv cs.LG · hace 2 h

Estabilización de creencias en LLM mediante remuestreo predictivo con indicaciones

Los modelos de lenguaje grandes presentan una deriva temprana de las creencias en la respuesta a preguntas de opción múltiple, violando la propiedad de martingala. El remuestreo predictivo con indicaciones (PPR) revela esta deriva, que se autoestabiliza tras un remuestreo suficiente, conduciendo a distribuciones predictivas coherentes. Proponemos una estrategia de indicación con respuesta semilla y una pérdida de autoconsistencia para acelerar la estabilización y reducir la deriva, mejorando la coherencia predictiva sin afectar la precisión.