Todos los artículos
arxiv arXiv cs.LG · hace 2 h

Escalado de AEB con datos no etiquetados mediante SSL de meta-retroalimentación

Un marco de aprendizaje semi-supervisado de meta-retroalimentación permite escalar el frenado automático de emergencia utilizando grandes volúmenes de datos de flota no etiquetados. El enfoque estabilizado reduce los errores de pseudoetiquetas y suprime las alucinaciones de riesgo, logrando una relación de 100:1 entre activaciones positivas y falsas, y un 35% más de kilómetros conducidos sin accidentes en comparación con una línea base solo basada en reglas en despliegues del mundo real.

arxiv arXiv cs.LG · hace 2 h

Adaptación en tiempo de prueba con Flow-Matching para la eliminación de ruido en imágenes OCT

Un método basado en flow-matching alinea las imágenes OCT en tiempo de prueba con trayectorias de referencia sintéticas, igualando distribuciones de histograma para reducir las discrepancias de píxeles inducidas por el ruido. Al eliminar la condición temporal, el modelo se adapta a las variaciones del ruido del mundo real, logrando una segmentación de biomarcadores de última generación en etapas de degeneración macular asociada a la edad.

arxiv arXiv cs.LG · hace 2 h

Redes neuronales conscientes del cambio de dominio para la estimación de masas desbalanceadas

Se propone una red neuronal consciente del cambio de dominio para estimar masas desbalanceadas en ejes rotativos bajo condiciones operativas variables. El modelo utiliza la discrepancia media máxima para alinear las representaciones de características entre diferentes dominios operacionales, mejorando la precisión de la predicción cuando los comportamientos del sistema difieren de las condiciones de entrenamiento. Los resultados muestran su efectividad en aplicaciones de monitoreo de salud estructural donde las discrepancias de dominio son desconocidas o no consideradas.

arxiv arXiv cs.LG · hace 2 h

SDE latentes para la detección de anomalías en series temporales multivariadas dispersas

Proponemos un método generativo que utiliza SDE latentes para detectar anomalías en series temporales multivariadas dispersas e irregulares. El enfoque proyecta los datos observados sobre sistemas estocásticos en tiempo continuo, manejando valores faltantes y muestreo irregular mientras captura patrones cíclicos. Los experimentos en seis conjuntos de datos de referencia muestran que nuestro método logra un rendimiento destacado, superando a las líneas base más avanzadas, especialmente bajo una alta dispersión de los datos.

arxiv arXiv cs.LG · hace 2 h

REVES: Entrenamiento aumentado para escalado en tiempo de prueba

REVES introduce un marco iterativo de dos etapas que mejora el razonamiento de los LLM mediante revisión y verificación secuenciales. Logra +6.5 puntos sobre las líneas base de RL y +4.0 puntos sobre el entrenamiento estándar multi-turno en LiveCodeBench, utilizando un modelo base de 4B con menos rollouts que los sistemas evolutivos grandes. El método mejora la corrección de errores y se generaliza a acertijos fuera de distribución como n_queens y mini_sudoku.

arxiv arXiv cs.LG · hace 2 h

TransitNet alcanza una precisión del 95.2% en búsquedas de tránsitos con baja relación señal-ruido

TransitNet, un marco compacto de aprendizaje profundo aumentado con atención, alcanza una precisión del 95.2% en búsquedas ciegas de tránsitos con baja SNR, superando a TLS y BLS en valores ROC-AUC y PR-AP. Recupera el 93.0% de los tránsitos inyectados de tamaño terrestre y subterrestre, con el 97.4% de los tránsitos inyectados completamente cubiertos por las ventanas de tránsito estimadas, y recupera exitosamente los 34 planetas confirmados de Kepler con un error medio en el punto medio de 1.24 horas.

arxiv arXiv cs.LG · hace 2 h

Adquisición activa de características zero-shot mediante elicitation con LLM

Un nuevo marco permite la adquisición activa de características zero-shot aprovechando LLMs para elicitar solo estadísticas discriminatorias como desviaciones unarias y covariaciones por pares. Mediante cierre de máxima entropía, resuelve la ambigüedad en la selección de características y supera a los propios LLMs, especialmente en casos desafiantes de pacientes con EII donde la incertidumbre diagnóstica es alta.

arxiv arXiv cs.LG · hace 2 h

Optimización de recompensas no supervisada para modelos de lenguaje de proteínas

Un nuevo marco permite a los modelos de lenguaje de proteínas generar secuencias de proteínas controlables sin datos etiquetados ni validación de laboratorio húmedo. Utiliza recompensas independientes de la tarea basadas en la incertidumbre del modelo y la consistencia semántica para guiar la generación, con Optimización de Recompensa Suave y Binarizada superando a las líneas base en cobertura y controlabilidad bajo diversas condiciones.

arxiv arXiv cs.LG · hace 2 h

Aprendizaje sin recompensa a partir de flujos perceptuales

Un nuevo marco permite el aprendizaje en línea con recompensas y castigos sin recompensas del entorno, utilizando únicamente paquetes perceptuales de canal fijo. Alcanza alta precisión en la inferencia de valores y la optimización de políticas, con B_xi logrando una precisión equilibrada de 0.952 en la señal de recompensa y el rendimiento general de la política alcanzando una precisión de acción óptima de 0.979 en las tareas evaluadas, superando a los controles como recompensa cero y objetivos aleatorizados.

arxiv arXiv cs.LG · hace 2 h

EfficientRollout: Descodificación autoespeculativa consciente del sistema para rollouts de RL

EfficientRollout introduce un marco de descodificación autoespeculativa que reduce el rollout y la latencia end-to-end hasta en un 19,6% y un 12,7% respectivamente, sin comprometer la calidad final del modelo. Utiliza un drafter cuantizado derivado del modelo objetivo e integra una política de conmutación consciente del sistema para evitar regímenes limitados por el cómputo, permitiendo una especulación efectiva durante las generaciones de políticas en evolución.

arxiv arXiv cs.LG · hace 2 h

La augmentación con GAN cuántico no muestra beneficios en la resonancia magnética cerebral

Una prueba controlada no encuentra una ganancia significativa de rendimiento en la augmentación de imágenes de resonancia magnética cerebral mediante modelos generativos cuánticos. Las muestras sintéticas producidas por GANs cuánticos y clásicos son estadísticamente indistinguibles, mostrando ambos colapso de modos y muestras fuera de distribución, especialmente con fracciones bajas de datos. El estudio concluye que la augmentación cuántica no supera a los métodos clásicos y actúa más como regularización que como expansión de datos.

arxiv arXiv cs.LG · hace 2 h

FOSC-X: Marco para Agrupamientos Planos Óptimos de Top-M

FOSC-X permite la extracción de los agrupamientos planos globalmente óptimos de top-M de árboles jerárquicos de agrupamiento mediante cortes locales no horizontales. Admite restricciones de conteo de agrupamientos y garantiza clasificaciones óptimas con complejidad lineal, tanto con como sin restricciones, mientras revela estructuras de agrupamiento alternativas pasadas por alto por métodos de solución única.

arxiv arXiv cs.LG · hace 2 h

DIPHINE: Estimador neuronal para $Φ$-ID en sistemas continuos

DIPHINE es el primer estimador neuronal que utiliza modelos de difusión basados en puntuación para estimar conjuntamente todos los términos de información mutua requeridos por la Descomposición de Información Integrada ($Φ$ID) a partir de una única red amortizada. Recupera los dieciséis átomos de información no superpuestos mediante inversión de Möbius y proporciona un análisis teórico que muestra que la estimación sinergia-a-sinergia es la más desafiante, con resultados precisos en benchmarks sintéticos y datos fisiológicos del mundo real.

arxiv arXiv cs.LG · hace 2 h

Sumi: Modelo de lenguaje de difusión uniforme abierto desde cero

Sumi es un modelo de lenguaje de difusión uniforme de 7B parámetros preentrenado desde cero con 1.5T tokens. Compite con modelos autoregresivos en tareas de conocimiento, razonamiento y codificación, pero tiene un rendimiento inferior en benchmarks de sentido común, probablemente debido a su mezcla de datos centrada en la educación. Los pesos del modelo, los puntos de control y la receta completa de entrenamiento se han liberado públicamente.

arxiv arXiv cs.LG · hace 2 h

Moat: Análisis dinámico consciente del ciclo de vida para la ejecución segura de modelos de ML

Moat es un enfoque de análisis dinámico que asegura la ejecución de modelos de ML monitoreando las interacciones del sistema anfitrión durante fases bien definidas del ciclo de vida del modelo. Re-Moat, su implementación de referencia, detecta todas las clases de ataque evaluadas con una tasa de falsos positivos cercana a cero en 77,974 modelos del mundo real y múltiples frameworks, superando a las soluciones existentes de escaneo estático de modelos.

arxiv arXiv cs.LG · hace 2 h

FoMoE rompe la barrera de réplicas completas con capas de expertos particionadas

FoMoE introduce un sistema que particiona las capas de expertos entre trabajadores para evitar réplicas completas del modelo, reduciendo los costos de comunicación hasta 1.42x en comparación con las líneas base y 45.44x en comparación con DDP. Logra aceleraciones de rendimiento de hasta 1.4x mediante un mecanismo de salto de token y demuestra un enrutamiento estable, con beneficios proyectados que se extienden a modelos de escala 100B a través del modelado del sistema.