Todos los artículos
arxiv arXiv cs.LG · hace 4 h

Muestreador TR-CIE para Coincidencia de Flujo Discreto

Los investigadores proponen el muestreado de Extrapolación de Intensidad Acumulada con Reparametrización Temporal (TR-CIE) para mejorar la calidad del muestreo en la coincidencia de flujo discreto cuando las evaluaciones de función están restringidas. El método combina la reparametrización temporal basada en horarios con una regla de actualización de extrapolación de intensidad acumulada para mitigar la rigidez y mejorar la precisión de la aproximación.

arxiv arXiv cs.LG · hace 4 h

AsyncOPD: ¿Qué tan obsoleta puede ser la destilación on-policy?

Este artículo presenta AsyncOPD, una tubería de destilación on-policy completamente asíncrona que desacopla la generación de rollouts de las actualizaciones del aprendiz para aliviar los cuellos de botella de entrenamiento en el post-entrenamiento de modelos de lenguaje grandes. Los autores proporcionan el primer estudio sistemático de los efectos de la obsolescencia (staleness) en este contexto, demostrando que la divergencia KL directa ponderada por el maestro es robusta frente a rollouts obsoletos, mientras que la KL inversa ponderada por el estudiante es vulnerable.

lab Microsoft Research Blog · hace 4 h

Memora: Una representación de memoria armónica que equilibra abstracción y especificidad

Microsoft Research presenta Memora, un marco de memoria agnóstica escalable diseñado para equilibrar la abstracción y la especificidad en tareas de IA a largo plazo. El sistema desacopla el contenido rico de la memoria de las estructuras de recuperación ligeras, estableciendo nuevos resultados de vanguardia en benchmarks mientras utiliza hasta un 98% menos de tokens de contexto.

arxiv arXiv cs.LG · hace 5 h

Generación de video autónoma con controlabilidad contrafáctica para modelos del mundo autoevolutivos

El artículo sostiene que los modelos actuales de generación de video aprenden solo modelos del mundo espaciotemporales parciales e implícitos, en lugar de completamente fundamentados o controlables. Afirma que la realismo predictivo por sí solo es insuficiente para crear agentes físicos porque estos modelos a menudo fallan al identificar variables controlables y restricciones de encarnación.

arxiv arXiv cs.LG · hace 5 h

BehaviorBench: Evaluación de modelos fundamentales para tareas de ciencias del comportamiento

Los autores presentan BehaviorBench, un benchmark integral diseñado para evaluar modelos fundamentales en diversas tareas y poblaciones de ciencias del comportamiento. El estudio evalúa cuatro capacidades principales—predicción de comportamiento, toma de decisiones estratégicas, inferencia de rasgos del sujeto y aplicación de conocimiento conductual—tanto a nivel individual como distribucional.

arxiv arXiv cs.LG · hace 5 h

Modelos de Transformer ligeros para detección de fallos en dispositivo: Un estudio de referencia sobre implementación con recursos limitados

Este estudio compara métodos tradicionales de aprendizaje automático frente a arquitecturas de transformer ligeras para la detección binaria de fallos en tres conjuntos de datos públicos, evaluando los compromisos entre precisión, tamaño del modelo y latencia. La investigación evalúa el rendimiento de clasificación utilizando F1-score y AUC, mientras también prueba la cuantización dinámica INT8 y un pipeline de inferencia adaptativo en dos etapas para optimizar la implementación en hardware con recursos limitados.

arxiv arXiv cs.LG · hace 5 h

Proyecto Ariadne: Generación de rutas condicionada por prompt para la planificación de síntesis

Los investigadores presentan Ariadne, un modelo solo de decodificador que reformula la planificación retrosintética como generación de secuencia condicionada por prompt, permitiendo que las moléculas objetivo, las restricciones y las rutas se representen en una sola secuencia. Este enfoque elimina la necesidad de modelos separados adaptados a especificaciones de planificación específicas.

media r/LocalLLaMA · hace 5 h

Usuario de Reddit critica las afirmaciones de Dario Amodei sobre IA de código abierto

Un usuario de Reddit argumenta que el CEO de Anthropic, Dario Amodei, comprende fundamentalmente mal cómo funcionan los modelos de IA de código abierto, refutando específicamente su reciente testimonio ante el Congreso del 28 de junio de 2026. El autor sostiene que las afirmaciones de Amodei sobre transparencia y accesibilidad son incorrectas desde el punto de vista factual basándose en el estado actual de los modelos de pesos abiertos.

arxiv arXiv cs.LG · hace 6 h

MotifGen: Interpolación espacio-temporal de imágenes satelitales desalineadas mediante modelado generativo multi-fuente

Los investigadores presentan MotifGen, un modelo generativo diseñado para la interpolación espacio-temporal de imágenes de microondas de ciclones tropicales a partir de múltiples fuentes geoespaciales con intervalos de tiempo irregulares y desalineación geográfica. El modelo aborda el desafío de la alta heterogeneidad en los datos de microondas combinando entradas de varios instrumentos para llenar los vacíos causados por los largos tiempos de revisita satelital.

arxiv arXiv cs.LG · hace 6 h

PROTECT-90: Un conjunto de datos de fallos para la protección de sistemas eléctricos

Este artículo presenta el conjunto de datos PROTECT-90, una referencia de benchmark simulada por transitorios electromagnéticos (EMT) y de acceso abierto diseñada para abordar la falta de conjuntos de datos de formas de onda de alta tensión estandarizados y disponibles públicamente para la protección de sistemas eléctricos. El lanzamiento tiene como objetivo permitir una evaluación transparente y reproducible de métodos basados en datos mediante mediciones consistentes similares a las de registradores digitales de fallos.

arxiv arXiv cs.LG · hace 6 h

Gestión de la ejecución de tareas para cargas de trabajo desconocidas en IoT sin batería: Una evaluación agnóstica al hardware

Este estudio propone dos estrategias dinámicas de programación agnósticas al hardware, un agente de Aprendizaje por Refuerzo libre de modelos y un método de Predición Aproximada sobre la marcha, para gestionar la energía volátil en sistemas IoT sin batería sin perfiles previos de tareas. Evaluadas frente a líneas base adaptativas y estáticas utilizando un marco de simulación personalizado, la investigación destaca compensaciones operativas distintas para diferentes restricciones del sistema.