Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 98

DeepGaLA: Sustitutos neuronales con incertidumbre para problemas inversos de EDP

DeepGaLA es un sustituto basado en redes neuronales que proporciona predicciones conscientes de la incertidumbre para problemas inversos en ecuaciones diferenciales parciales. Logra una precisión comparable a los sustitutos de procesos gaussianos, manteniendo la eficiencia en espacios de parámetros de alta dimensión e incorporando restricciones de ecuaciones diferenciales.

arxiv arXiv cs.LG · hace 2 h

Estudio mecanicista de la retención de representación en aprendizaje continuo

Un marco sintético revela que la superposición aumenta con el tiempo con caídas transitorias en los límites de las tareas, lo que indica interferencia específica del límite. Una mayor esparsidad de características promueve la superposición sin un olvido inevitable, siempre que se mantenga la fuerza de la representación. El rango efectivo a nivel de tarea crece con la esparsidad, mostrando un uso más amplio de la capacidad bajo condiciones dispersas.

media r/LocalLLaMA · hace 2 h

DeepSpec: Una colección de modelos de borrador para descodificación especulativa de DeepSeek AI

DeepSpec es una base de código completa lanzada por deepseek-ai para entrenar y evaluar modelos de borrador utilizados en la descodificación especulativa. El proyecto proporciona utilidades de preparación de datos, código de implementación y scripts de evaluación para facilitar el desarrollo de estos modelos auxiliares.

arxiv arXiv cs.LG · hace 2 h

HEPTv2: Transformador de puntos eficiente de extremo a extremo para la reconstrucción de partículas cargadas

HEPTv2 logra una eficiencia de rastreo del 98,6% con una tasa de falsos del 0,8% en TrackML, utilizando solo 15 ms de tiempo de inferencia y 0,4 GB de memoria por evento. Supera a los métodos anteriores basados en transformadores y grafos en eficiencia y reduce la latencia por factores de 7 y 38–52, respectivamente, permitiendo la reconstrucción de partículas en tiempo real en el HL-LHC.

arxiv arXiv cs.LG · hace 2 h

Optimización evolutiva de hiperparámetros en dos etapas para PINNs

Una estrategia evolutiva en dos etapas mejora el rendimiento de las Redes Neuronales Informadas por Física (PINNs) mediante la selección preliminar de candidatos a hiperparámetros con entrenamiento de baja fidelidad, y luego refinando los mejores candidatos con optimización basada en gradientes. El enfoque reduce significativamente el error medio en problemas de ecuaciones de Advección, Klein-Gordon y Helmholtz bajo presupuestos computacionales fijos.

arxiv arXiv cs.LG · hace 2 h

Análisis de datos topológicos para la monitorización de procesos en tiempo real

Un nuevo método combina el análisis de datos topológicos y el aprendizaje automático para monitorizar procesos dinámicos de alta dimensión. Representa los datos de series temporales como variedades, utiliza descriptores topológicos para capturar la estructura y emplea ecuaciones diferenciales ordinarias neuronales para modelar la evolución dinámica. El enfoque detecta eficazmente diversos eventos en datos de procesos industriales y supera a las alternativas basadas en reconstrucción y trayectorias.

arxiv arXiv cs.LG · hace 2 h

Reutilización de un clasificador de voz para generación basada en difusión

Un clasificador de voz preentrenado se reutiliza como columna vertebral para la generación de voz guiada por difusión. Al adjuntar una subred ligera y entrenarla bajo emparejamiento de puntuaciones de desvanecimiento, el enfoque logra alta calidad de voz con menor consumo de memoria y costo computacional, utilizando un único modelo en lugar de dos componentes entrenados por separado.

arxiv arXiv cs.LG · hace 2 h

Mitigación del sesgo bajo restricciones de cobertura y el precio de la equidad

Un nuevo marco aborda el sesgo de datos en el aprendizaje automático incorporando restricciones de cobertura para garantizar una representación suficiente de subgrupos interseccionales. Intercambia pequeños errores de sesgo por una mayor eficiencia de los datos y formula la mitigación del sesgo como un programa lineal entero, caracterizando el precio de la equidad en función de la tolerancia a la equidad para guiar la gobernanza de datos y el cumplimiento legal.

arxiv arXiv cs.LG · hace 2 h

Búsqueda Simbólica Agéntica para la Caracterización de Soluciones de EDP

ASYS propone un marco guiado por previos que utiliza teoría matemática y búsqueda evolutiva para generar formas simbólicas interpretables de soluciones de EDP. Produce representaciones analíticas para problemas complejos como la dinámica de Allen-Cahn y el blow-up de Keller-Segel, ofreciendo nuevas vías para el análisis matemático más allá de los métodos tradicionales.

arxiv arXiv cs.LG · hace 2 h

La nitidez riemanniana explica el sesgo de SGD hacia mínimos planos

Este estudio introduce la nitidez riemanniana, una medida de planitud invariante a reparametrizaciones basada en la geometría de la Matriz de Información de Fisher. Demuestra que la distribución estacionaria de SGD se concentra en mínimos riemannianamente planos y vincula este sesgo geométrico con la generalización mediante un límite PAC-Bayes. Los experimentos en MNIST y CIFAR-10 muestran que la nitidez riemanniana rastrea mejor la generalización que la nitidez euclidiana, con un escalado consistente con la teoría.

arxiv arXiv cs.LG · hace 2 h

UltraQuant: Caché KV de 4 bits para agentes con alta carga de contexto

UltraQuant introduce un método de caché KV de 4 bits diseñado para cargas de trabajo de agentes con alta demanda de contexto. Logra una reducción de 3.47x en el tiempo P50 hasta el primer token en rondas tardías y un aumento de 1.63x en el rendimiento de salida en comparación con el caché KV FP8, utilizando consultas FP8, tensores KV FP4 y soporte nativo AMD CDNA4 para scaled-MFMA.

arxiv arXiv cs.AI · hace 2 h

Modelos de base EEG para la detección de supresión por ráfagas en UCI

Un estudio evalúa Modelos de base EEG para la detección de supresión por ráfagas basada en eventos en entornos de UCI sin calibración específica del paciente. REVE-base logró la puntuación F1 basada en eventos más alta de 0.868 y redujo el error de ráfagas por minuto en un 52.1% en comparación con EEGNet y un 36.2% en comparación con la umbralización adaptativa, demostrando un rendimiento superior. Los resultados de ablation muestran que el ajuste fino completo supera a otras estrategias, y REVE-base preentrenado supera la inicialización aleatoria por 0.723 puntos F1 con el 25% de datos etiquetados, destacando el valor del preentrenamiento para conjuntos de datos limitados.

arxiv arXiv cs.LG · hace 2 h

Acumulación de Ventaja Marginal para la Autoevolución de Agentes Impulsada por Memoria

Este artículo presenta la Acumulación de Ventaja Marginal (MAA), una arquitectura de postprocesamiento que aborda la inconsistencia entre lotes en la autoevolución de agentes impulsada por memoria. MAA formaliza la alineación y comparabilidad como condiciones estructurales, utiliza señales diferenciales y promedio móvil exponencial para acumular evidencia firmada por operación, y garantiza la trazabilidad mediante la fusión de identidad semántica. Supera a las líneas base a nivel de lote en 14 de cada 16 configuraciones y reduce el consumo de tokens en aproximadamente un 75%.

arxiv arXiv cs.LG · hace 2 h

El conjunto de datos RefRad2D permite la fundamentación espacial escalable en radiología

RefRad2D es un conjunto de datos bilingüe a gran escala de 1.2M pares de imagen-texto de TC y RM de la práctica clínica. Entrenado con estos datos, RadGrounder logra resultados competitivos en VQA y generación de informes mientras mantiene la calidad del lenguaje mediante la supervisión de fundamentación espacial sin degradación del rendimiento.

arxiv arXiv cs.LG · hace 2 h

Alineación de LLM mediante Retroalimentación Implícita del Usuario

Un nuevo conjunto de datos, IFLLM, recopila trayectorias del ratón y datos de fijación ocular de usuarios que interactúan con LLMs. Muestra que la retroalimentación implícita mejora significativamente la alineación de LLMs, aumentando la precisión del modelo de recompensa basado en texto del 55% al 64% y casi triplicando las mejoras en la calidad de respuesta después del entrenamiento DPO en ocho LLMs.

arxiv arXiv cs.LG · hace 2 h

Propagación del sesgo del evaluador en sistemas de LLM multi-agente

Contagion Networks introduce un marco para medir cómo se propagan los sesgos del evaluador entre agentes de LLM. En un experimento con 3 agentes, los sesgos se propagan con coeficientes entre 0.157 y 0.352, y los agentes con modelos homogéneos muestran una contagiosidad significativamente más débil que las configuraciones cruzadas entre modelos. Aumentar el tamaño del comité de evaluadores de k=1 a k=3 reduce la contagiosidad efectiva en un 72.4%.

arxiv arXiv cs.LG · hace 2 h

Estimación de entropía en sistemas multiqutrit con redes neuronales

Un estudio compara algoritmos cuánticos variacionales y CNN clásicas para la estimación de entropía de von Neumann en sistemas multiqutrit. Las CNN logran predicciones precisas y estables con solo el 12,5 % de las mediciones de tomografía completa del estado, alcanzando errores del percentil 90 de 0,13-0,16 nats para sistemas de cuatro y cinco qutrits, mostrando una mejora sistemática con el tamaño del sistema y robustez ante el ruido.

arxiv arXiv cs.LG · hace 2 h

Cómo los LLM alineados con la seguridad interpretan demostraciones mixtas de cumplimiento

Un estudio encuentra que las demostraciones benignas y dañinas de cumplimiento no son intercambiables en los modelos de lenguaje. Las demostraciones benignas pueden reducir o aumentar el cumplimiento dañino dependiendo del modelo, con la optimización de preferencias desempeñando un papel clave para prevenir el cumplimiento dañino. La investigación también revela sesgo de recencia en el orden de las demostraciones y comportamientos variados de los modelos al manejar rechazos durante el aprendizaje in-context.

arxiv arXiv cs.LG · hace 2 h

El ajuste de prueba y refinamiento mejora el rendimiento de los agentes de codificación

Un nuevo método llamado ajuste de prueba y refinamiento utiliza sondas sintéticas de corrección de errores para mejorar iterativamente los archivos de guía del repositorio con llamadas LLM de un solo disparo, sin bucles de agente ni uso de herramientas. En SWE-bench Verified, alcanza una tasa media de resolución del 33,0 % —14,5 puntos porcentuales más alta que la base de conocimientos estática inicial—, lo que muestra una cobertura mejorada en lugar de una precisión de parche. El método permite a los agentes utilizar presupuestos de pasos más grandes de manera efectiva, y el rendimiento se mantiene estable entre modelos cuando la salida diagnóstica es suficiente.

arxiv arXiv cs.LG · hace 2 h

Corredor de Ejecución Soberana para Control Agéntico Vinculado a Certificados

El Corredor de Ejecución Soberana (SEB) introduce un límite de aplicación en tiempo de ejecución que verifica y ejecuta la autoridad certificada en sistemas agénticos. Garantiza que la autoridad de mutación en producción esté aislada del razonamiento no determinista mediante la validación de contratos de ejecución, ventanas de validez y estados de revocación antes de invocar las APIs de infraestructura. El prototipo demuestra una ejecución segura y auditable en AWS y Kubernetes con latencia medible y resiliencia ante fallos.