Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 1 / 86

arxiv arXiv cs.LG · hace 2 h

TransitNet alcanza una precisión del 95.2% en búsquedas de tránsitos con baja relación señal-ruido

TransitNet, un marco compacto de aprendizaje profundo aumentado con atención, alcanza una precisión del 95.2% en búsquedas ciegas de tránsitos con baja SNR, superando a TLS y BLS en valores ROC-AUC y PR-AP. Recupera el 93.0% de los tránsitos inyectados de tamaño terrestre y subterrestre, con el 97.4% de los tránsitos inyectados completamente cubiertos por las ventanas de tránsito estimadas, y recupera exitosamente los 34 planetas confirmados de Kepler con un error medio en el punto medio de 1.24 horas.

arxiv arXiv cs.LG · hace 2 h

Adquisición activa de características zero-shot mediante elicitation con LLM

Un nuevo marco permite la adquisición activa de características zero-shot aprovechando LLMs para elicitar solo estadísticas discriminatorias como desviaciones unarias y covariaciones por pares. Mediante cierre de máxima entropía, resuelve la ambigüedad en la selección de características y supera a los propios LLMs, especialmente en casos desafiantes de pacientes con EII donde la incertidumbre diagnóstica es alta.

arxiv arXiv cs.LG · hace 2 h

Optimización de recompensas no supervisada para modelos de lenguaje de proteínas

Un nuevo marco permite a los modelos de lenguaje de proteínas generar secuencias de proteínas controlables sin datos etiquetados ni validación de laboratorio húmedo. Utiliza recompensas independientes de la tarea basadas en la incertidumbre del modelo y la consistencia semántica para guiar la generación, con Optimización de Recompensa Suave y Binarizada superando a las líneas base en cobertura y controlabilidad bajo diversas condiciones.

arxiv arXiv cs.LG · hace 2 h

Aprendizaje sin recompensa a partir de flujos perceptuales

Un nuevo marco permite el aprendizaje en línea con recompensas y castigos sin recompensas del entorno, utilizando únicamente paquetes perceptuales de canal fijo. Alcanza alta precisión en la inferencia de valores y la optimización de políticas, con B_xi logrando una precisión equilibrada de 0.952 en la señal de recompensa y el rendimiento general de la política alcanzando una precisión de acción óptima de 0.979 en las tareas evaluadas, superando a los controles como recompensa cero y objetivos aleatorizados.

arxiv arXiv cs.LG · hace 2 h

EfficientRollout: Descodificación autoespeculativa consciente del sistema para rollouts de RL

EfficientRollout introduce un marco de descodificación autoespeculativa que reduce el rollout y la latencia end-to-end hasta en un 19,6% y un 12,7% respectivamente, sin comprometer la calidad final del modelo. Utiliza un drafter cuantizado derivado del modelo objetivo e integra una política de conmutación consciente del sistema para evitar regímenes limitados por el cómputo, permitiendo una especulación efectiva durante las generaciones de políticas en evolución.

arxiv arXiv cs.LG · hace 2 h

La augmentación con GAN cuántico no muestra beneficios en la resonancia magnética cerebral

Una prueba controlada no encuentra una ganancia significativa de rendimiento en la augmentación de imágenes de resonancia magnética cerebral mediante modelos generativos cuánticos. Las muestras sintéticas producidas por GANs cuánticos y clásicos son estadísticamente indistinguibles, mostrando ambos colapso de modos y muestras fuera de distribución, especialmente con fracciones bajas de datos. El estudio concluye que la augmentación cuántica no supera a los métodos clásicos y actúa más como regularización que como expansión de datos.

arxiv arXiv cs.LG · hace 2 h

FOSC-X: Marco para Agrupamientos Planos Óptimos de Top-M

FOSC-X permite la extracción de los agrupamientos planos globalmente óptimos de top-M de árboles jerárquicos de agrupamiento mediante cortes locales no horizontales. Admite restricciones de conteo de agrupamientos y garantiza clasificaciones óptimas con complejidad lineal, tanto con como sin restricciones, mientras revela estructuras de agrupamiento alternativas pasadas por alto por métodos de solución única.

arxiv arXiv cs.LG · hace 2 h

Prueba robusta de independencia condicional secuencial

Un nuevo método introduce apuestas adaptativas con estadísticas de kernel para probar la independencia condicional, reduciendo la inflación del error de Tipo I debido al error de estimación. Supera a los enfoques existentes de Model-X secuenciales tanto en tareas de equidad sintéticas como del mundo real, manteniendo una alta potencia y siendo más robusto ante errores de estimación distribucional.

arxiv arXiv cs.LG · hace 2 h

DIPHINE: Estimador neuronal para $Φ$-ID en sistemas continuos

DIPHINE es el primer estimador neuronal que utiliza modelos de difusión basados en puntuación para estimar conjuntamente todos los términos de información mutua requeridos por la Descomposición de Información Integrada ($Φ$ID) a partir de una única red amortizada. Recupera los dieciséis átomos de información no superpuestos mediante inversión de Möbius y proporciona un análisis teórico que muestra que la estimación sinergia-a-sinergia es la más desafiante, con resultados precisos en benchmarks sintéticos y datos fisiológicos del mundo real.

arxiv arXiv cs.LG · hace 2 h

Destacado: Uso de GPUs Spot para acelerar el post-entrenamiento RL de DiT

Spotlight permite el post-entrenamiento RL de DiT aprovechando GPUs spot inactivas, reduciendo los costos entre 1.4 y 6.4 veces mientras se logra una calidad de imagen superior. Utiliza pesos de modelo obsoletos en la exploración y reconfigura el paralelismo de secuencias sobre la marcha, permitiendo un uso eficiente de las GPUs sin interrumpir los pipelines de entrenamiento.

arxiv arXiv cs.LG · hace 2 h

Sumi: Modelo de lenguaje de difusión uniforme abierto desde cero

Sumi es un modelo de lenguaje de difusión uniforme de 7B parámetros preentrenado desde cero con 1.5T tokens. Compite con modelos autoregresivos en tareas de conocimiento, razonamiento y codificación, pero tiene un rendimiento inferior en benchmarks de sentido común, probablemente debido a su mezcla de datos centrada en la educación. Los pesos del modelo, los puntos de control y la receta completa de entrenamiento se han liberado públicamente.

arxiv arXiv cs.LG · hace 2 h

Moat: Análisis dinámico consciente del ciclo de vida para la ejecución segura de modelos de ML

Moat es un enfoque de análisis dinámico que asegura la ejecución de modelos de ML monitoreando las interacciones del sistema anfitrión durante fases bien definidas del ciclo de vida del modelo. Re-Moat, su implementación de referencia, detecta todas las clases de ataque evaluadas con una tasa de falsos positivos cercana a cero en 77,974 modelos del mundo real y múltiples frameworks, superando a las soluciones existentes de escaneo estático de modelos.

arxiv arXiv cs.LG · hace 2 h

FoMoE rompe la barrera de réplicas completas con capas de expertos particionadas

FoMoE introduce un sistema que particiona las capas de expertos entre trabajadores para evitar réplicas completas del modelo, reduciendo los costos de comunicación hasta 1.42x en comparación con las líneas base y 45.44x en comparación con DDP. Logra aceleraciones de rendimiento de hasta 1.4x mediante un mecanismo de salto de token y demuestra un enrutamiento estable, con beneficios proyectados que se extienden a modelos de escala 100B a través del modelado del sistema.

arxiv arXiv cs.LG · hace 2 h

El Transformador de Visión LSTM mejora la predicción del error de pronóstico HRRR

Un marco híbrido de LSTM-Transformador de Visión mejora la predicción de errores de pronóstico HRRR al integrar perfiles atmosféricos de profilers de mesonet. Logra hasta una mejora de dos veces en la predicción del error de precipitación, especialmente durante períodos de capa límite planetaria activa, al capturar mejor la evolución del error convectivo y reducir la degradación relacionada con la PBL.

arxiv arXiv cs.LG · hace 2 h

Análisis geométrico y estocástico de las discontinuidades en Mezclas de Expertos dispersas

Este artículo analiza las discontinuidades en los modelos de Mezcla de Expertos dispersas, clasificándolas por orden y demostrando que las discontinuidades de menor orden dominan en volumen. Demuestra que las trayectorias de entrada aleatorias casi seguramente golpean primero una discontinuidad de orden 1 con cotas de probabilidad en tiempo finito y deriva cotas del tiempo de ocupación para cada orden. Se propone un mecanismo de suavizado simple que mejora la continuidad y el rendimiento del modelo con una sobrecarga computacional mínima.

arxiv arXiv cs.LG · hace 2 h

Codificador de voz a pico aprendible para Redes Neuronales Espigadas

Un codificador residual de voz a pico aprendible se entrena conjuntamente con una red Recurrent Leaky Integrate-and-Fire, alcanzando hasta un 94.97% de precisión en el benchmark Google Speech Commands v2. Una versión de 35k parámetros alcanza el 89.8%, superando a métodos anteriores con muchos menos parámetros, y muestra representaciones de pico alineadas con la tarea que mejoran la separabilidad de clases.

arxiv arXiv cs.LG · hace 2 h

Aprendizaje Positivo-Sin Etiquetar para la Auditoría de Evaluación de LLM

Un nuevo marco utiliza aprendizaje positivo-sin etiquetar y Transporte Óptimo Parcial para audiar sesgos en la evaluación de LLM. Alinea salidas positivas verificadas por humanos con respuestas del modelo sin etiquetar en el espacio de incrustaciones, identificando preferencias humanas consistentes y corrigiendo el sesgo de verbosidad sin reentrenamiento. Los experimentos muestran una mejor alineación humana, robustez frente a sesgos de presentación y estimaciones de confianza interpretables.

arxiv arXiv cs.LG · hace 2 h

Tipos de recompensa en RL mejoran la resiliencia en sistemas ciberfísicos

Un estudio evalúa controladores de aprendizaje por refuerzo sin modelo en sistemas no lineales bajo ataques cibernéticos. La recompensa de Lyapunov ofrece la mejor resiliencia con bajo error de seguimiento, mientras que Proximal Policy Optimization supera a Deep Deterministic Policy Gradient en la reducción de la varianza de KPI.

arxiv arXiv cs.LG · hace 2 h

Optimización de seguimiento con conciencia del contexto para la diabetes tipo 2

Un estudio utiliza un Proceso de Decisión de Markov Contextual para optimizar los intervalos de seguimiento para pacientes con diabetes tipo 2 basándose en datos de EHR de 22,154 pacientes. El modelo identifica dos contextos clínicos—riesgo bajo y alto—y recomienda intervalos adaptativos: 1 mes para valores de laboratorio no medidos, hasta 3 meses para valores elevados o hospitalizaciones, y 6–12 meses para control estable, con intervalos más cortos para pacientes de alto riesgo. Las políticas CMDP redujeron los costos acumulados esperados en un 34.8% en contextos de alta comorbilidad y un 6.4% en contextos de baja comorbilidad en comparación con una política de intervalo fijo.

arxiv arXiv cs.LG · hace 2 h

Arquitecturas de estructura primera para el aprendizaje dinámico

Un nuevo paradigma para el aprendizaje de sistemas dinámicos prioriza el diseño estructural sobre la expresividad no lineal. Las unidades dinámicas inspiradas en ondas utilizan interacciones explícitas y causales para formar arquitecturas en capas que emergen comportamiento jerárquico y representaciones internas informativas, incluso con una optimización mínima de parámetros.