Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 101

Marco LDT-FRL para IoMT ciberresiliente

El marco LDT-FRL introduce un sistema de defensa que preserva la privacidad para dispositivos IoMT, combinando atención temporal, gemelos digitales ligeros y aprendizaje por refuerzo federado. Alcanza una precisión del 99.66% y 99.95% en los benchmarks CICDDoS 2019 y TON-IoT, con F1 perfecto en la clase MITM, converge un 81% más rápido que métodos anteriores y ofrece decisiones de defensa interpretables mediante SHAP y Grad-CAM.

arxiv arXiv cs.LG · hace 1 h En vivo

Expertos de convolución con atención dual para la completación de tensores dispersos

DCGC introduce una red de convolución con atención dual y aprendizaje contrastivo a nivel de grupo para mejorar la completación de tensores dispersos. El método captura interacciones complejas entre modos y reduce la vulnerabilidad a la escasez de datos mediante señales autovigiladas, superando a los enfoques más avanzados en conjuntos de datos de tráfico y recomendación.

arxiv arXiv cs.LG · hace 1 h En vivo

Teorema del límite central para el optimizador Adam promediado

El artículo establece un teorema del límite central para el optimizador Adam promediado, mostrando convergencia en orden n^{-1/2}. Esta tasa coincide con los algoritmos clásicos de aproximación estocástica, con la covarianza expresada en términos de las propiedades del algoritmo en el estado atractor.

arxiv arXiv cs.LG · hace 1 h En vivo

Codificadores universales para aprendizaje profundo relacional modular

El artículo propone un enfoque de aprendizaje profundo relacional modular que desacopla la codificación de filas del paso de mensajes en grafos. Introduce un Codificador Universal de Filas basado en transformador que utiliza metadatos de esquema para generar incrustaciones invariantes de filas, lo que permite una mejor generalización entre bases de datos y mejora la convergencia en los benchmarks de RelBench.

arxiv arXiv cs.LG · hace 1 h En vivo

El marco BIPC acelera la optimización mixta entera con aprendizaje automático

El marco BIPC reduce el tiempo de solución para programas mixtos enteros a gran escala identificando un subconjunto puerta trasera de variables que impulsan la complejidad computacional. Mediante aprendizaje supervisado, predice los valores e intervalos de las variables puerta trasera y luego resuelve un problema reducido con estas predicciones, logrando aceleraciones significativas con una pérdida mínima de calidad. Esto permite soluciones rápidas y de alta calidad bajo perturbaciones de parámetros en sistemas del mundo real como redes eléctricas y cadenas de suministro.

arxiv arXiv cs.LG · hace 1 h En vivo

Mejora de habla post-entrenamiento con recompensas perceptuales

Un nuevo método post-entrenamiento utiliza recompensas perceptuales multi-métrica para optimizar modelos de mejora de habla. Aplica directamente métricas no diferenciables como DNSMOS, WER y UTMOS como recompensas mediante Group Sequence Policy Optimization, logrando resultados de última generación en DNS2020. La evaluación humana confirma que combinar múltiples métricas supera a los enfoques de métrica única, reduciendo el reward hacking.

arxiv arXiv cs.LG · hace 1 h En vivo

Los pipelines de espacio nativo superan al espacio de plantilla en la segmentación subcortical

Los pipelines UNet basados en espacio nativo superan a los del espacio de plantilla en la segmentación subcortical, mostrando puntuaciones Dice más altas y valores HD95 más bajos para el Núcleo Subtalámico, el Núcleo Rojo y la Sustancia Negra. El rendimiento disminuye significativamente cuando se aplican a imágenes 3T, con datos de entrenamiento sintéticos 3T que proporcionan solo ganancias modestas, destacando una brecha persistente entre MRI 7T y 3T.

arxiv arXiv cs.LG · hace 1 h En vivo

El arte ASCII permite a los LLM solo de texto controlar sistemas VLA

Un modelo de lenguaje grande solo de texto puede adaptarse en un controlador Visión--Lenguaje--Acción utilizando observaciones visuales renderizadas en ASCII. Este enfoque permite que los LLM interpreten estados visuales a través del texto, lo que les posibilita seguir instrucciones en lenguaje natural y generar acciones ejecutables tanto en simulación como en manipuladores físicos.

arxiv arXiv cs.LG · hace 1 h En vivo

El aprendizaje profundo fusiona datos de satélite con características meteorológicas para la estimación de la humedad del suelo

Un estudio valida un método de Función de Correlación Cruzada para identificar los retrasos temporales y de profundidad óptimos entre las variables meteorológicas y la humedad del suelo. Utilizando datos de satélite y meteorológicos en siete parcelas agrícolas del sureste de España, los modelos de aprendizaje profundo lograron mejoras significativas: un CNN por píxel alcanzó R² = 0.877, mientras que un híbrido CNN-LSTM logró el mejor rendimiento general con R² = 0.930. La información de profundidad subsuperficial y las características meteorológicas mejoraron sustancialmente la precisión de la estimación.

arxiv arXiv cs.LG · hace 1 h En vivo

La equivalencia del entrenamiento adversarial falla para modelos no lineales

Una prueba formal demuestra que no existe equivalencia entre el riesgo adversarial y el riesgo regularizado en redes de dos capas. Los resultados empíricos en Wide-ResNets confirman que esta imposibilidad persiste en arquitecturas más profundas y expresivas.

arxiv arXiv cs.LG · hace 1 h En vivo

Un modelo de aprendizaje automático predice pólipos colorrectales de alto riesgo en afroamericanos

Un modelo de aprendizaje automático desarrollado utilizando características clínicas previas a la colonoscopia predice pólipos colorrectales de alto riesgo en afroamericanos. El modelo, validado en una cohorte urbana diversa, utiliza datos demográficos, de estilo de vida y de comorbilidad para identificar pacientes con mayor riesgo, con validación externa realizada en 2023-2024.

arxiv arXiv cs.LG · hace 1 h En vivo

Desacoplar el conocimiento declarativo y procedimental en modelos de visión-lenguaje-acción

w$^{2}$VLA introduce un enfoque modular que desacopla el conocimiento declarativo y procedimental en los modelos de visión-lenguaje-acción. Al reestructurar el flujo de información, permite una clonación de comportamiento robusta y una transferencia de habilidades cero-shot sin precedentes a través de objetos no vistos y disímiles.

arxiv arXiv cs.LG · hace 1 h En vivo

Aprendizaje profundo con complejidad de tiempo paralelo O(log N)

El Aprendizaje Jerárquico Bloque-Local (HBLL) permite el entrenamiento de redes neuronales profundas con una complejidad de tiempo paralelo O(log N), eliminando la necesidad de retropropagación completa. HBLL descompone las redes en bloques vinculados jerárquicamente y logra un rendimiento competitivo en tareas de visión y lenguaje, con extensiones a arquitecturas recurrentes.

arxiv arXiv cs.LG · hace 1 h En vivo

La divergencia JS mejora la alineación de texto a imagen autoregresiva con GRPO

Un estudio introduce la divergencia JS en la alineación autoregresiva de texto a imagen al estilo GRPO, mostrando que equilibra eficazmente la optimización de la política y la diversidad de generación. Los experimentos en LlamaGen y Janus-7B demuestran que la divergencia JS logra un rendimiento superior o competitivo en todas las métricas mientras preserva salidas diversas.

arxiv arXiv cs.LG · hace 1 h En vivo

Aprendizaje de Grafos Temporales Federados con Preservación de Privacidad para IoMT Ciberresiliente

El artículo presenta Federated TGCN-A2C, un marco de trabajo con preservación de privacidad que alcanza una precisión de prueba del 99.48% y 99.61% en los benchmarks CICDDoS 2019 y TON-IoT, superando a Fed-Inforce-Fusion por 0.21 puntos porcentuales. Incluye detección de anomalías, puntuación basada en gemelos digitales, selección adaptativa de acciones y una capa de honeypot mejorada, con todas las clases principales de ataques logrando puntajes F1 superiores a 0.92 y 0.94, respectivamente, y proporciona explicabilidad post-hoc mediante SHAP, LIME, Grad-CAM y análisis de contrafácticos.

arxiv arXiv cs.LG · hace 1 h En vivo

Optimizador Muon: Potencia, Límites y una Teoría del Valle Fluvial

Una nueva teoría a nivel de trayectoria revela que Muon acelera al inicio de la optimización en la dirección del río portadora de información, pero converge lentamente cerca del fondo, a diferencia del descenso por gradiente. Con momento, las actualizaciones ortogonalizadas de Muon eliminan la información de escala residual, lo que lleva a sobrepasar y oscilar. El estudio aboga por un enfoque de dos etapas: usar Muon al principio y cambiar a optimizadores similares al descenso por gradiente más adelante, para mejorar el rendimiento del entrenamiento de LLM.

arxiv arXiv cs.LG · hace 1 h En vivo

Gradientes de Política Analíticos para el Control Continuo Eficiente

Los Gradientes de Política Analíticos (APG) permiten el cálculo exacto de gradientes mediante retropropagación a través de la simulación cuando las dinámicas del entorno son diferenciables. APG supera a la Optimización de Política Próxima (PPO) en cuatro tareas de control continuo, mostrando una eficiencia superior de muestras y aprendizaje con un esquema de retropropagación segmentada que reduce la degradación de gradientes en tareas de horizonte largo.

arxiv arXiv cs.LG · hace 1 h En vivo

GOMA logra la primera garantía de convergencia estocástica para desigualdades variacionales

El artículo presenta GOMA, una familia de métodos de primer orden para desigualdades variacionales monótonas. En el entorno estocástico con varianza no acotada, una variante simplificada de GOMA alcanza una tasa de convergencia del último iterado de O(1/\sqrt{k}) en la norma al cuadrado del gradiente, sin reducción de varianza ni lotes crecientes. Esta es la primera garantía de este tipo para desigualdades variacionales estocásticas monótonas de Lipschitz no acotadas.

arxiv arXiv cs.LG · hace 1 h En vivo

Filtrado de grafos eficiente en memoria para filtrado colaborativo escalable

Mem-GF introduce un método de filtrado de grafos eficiente en memoria que aproxima los filtros de grafos polinomiales utilizando subespacios de Krylov, eliminando la necesidad de almacenar el grafo completo de similitud entre elementos. Logra hasta 5.74× menos uso de memoria y 4.38× más velocidad de ejecución mientras mantiene una precisión de recomendación superior en comparación con los métodos de última generación, escalando eficazmente a conjuntos de datos con decenas de millones de interacciones.

arxiv arXiv cs.LG · hace 1 h En vivo

Destilando Transformers en Recurrent Transformers para Memoria Eficiente

Un nuevo método de destilación transfiere la estrategia de compresión de observaciones de los transformers de historial completo a modelos recurrentes. Al entrenar un modelo maestro para comprimir las historias de observaciones en cuellos de botella de tamaño fijo, el enfoque alinea la memoria del estudiante con la compresión del maestro. Esto permite que los recurrent transformers logren rendimiento cercano al de historial completo con complejidad de tiempo lineal, haciéndolos viables para aplicaciones de robótica a largo plazo.