Todos los artículos
arxiv arXiv cs.LG · hace 11 h

MotifGen: Interpolación espacio-temporal de imágenes satelitales desalineadas mediante modelado generativo multi-fuente

Los investigadores presentan MotifGen, un modelo generativo diseñado para la interpolación espacio-temporal de imágenes de microondas de ciclones tropicales a partir de múltiples fuentes geoespaciales con intervalos de tiempo irregulares y desalineación geográfica. El modelo aborda el desafío de la alta heterogeneidad en los datos de microondas combinando entradas de varios instrumentos para llenar los vacíos causados por los largos tiempos de revisita satelital.

arxiv arXiv cs.LG · hace 11 h

PROTECT-90: Un conjunto de datos de fallos para la protección de sistemas eléctricos

Este artículo presenta el conjunto de datos PROTECT-90, una referencia de benchmark simulada por transitorios electromagnéticos (EMT) y de acceso abierto diseñada para abordar la falta de conjuntos de datos de formas de onda de alta tensión estandarizados y disponibles públicamente para la protección de sistemas eléctricos. El lanzamiento tiene como objetivo permitir una evaluación transparente y reproducible de métodos basados en datos mediante mediciones consistentes similares a las de registradores digitales de fallos.

arxiv arXiv cs.LG · hace 11 h

Gestión de la ejecución de tareas para cargas de trabajo desconocidas en IoT sin batería: Una evaluación agnóstica al hardware

Este estudio propone dos estrategias dinámicas de programación agnósticas al hardware, un agente de Aprendizaje por Refuerzo libre de modelos y un método de Predición Aproximada sobre la marcha, para gestionar la energía volátil en sistemas IoT sin batería sin perfiles previos de tareas. Evaluadas frente a líneas base adaptativas y estáticas utilizando un marco de simulación personalizado, la investigación destaca compensaciones operativas distintas para diferentes restricciones del sistema.

arxiv arXiv cs.LG · hace 11 h

Segmentación BEV de vocabulario abierto con restricciones geométricas conscientes del 3D

Los autores presentan OVBEVSeg, un marco para la segmentación en vista de pájaro (BEV) de vocabulario abierto que utiliza modelos de visión-lenguaje para reconocer categorías más allá del conjunto de entrenamiento mientras mantiene una eficiencia en tiempo real. Para abordar la inconsistencia geométrica 3D inherente al elevar semánticas 2D a BEV, el método emplea restricciones geométricas 3D robustas a través de tres etapas progresivas.

arxiv arXiv cs.LG · hace 11 h

PHANTOM: Un conjunto de datos a gran escala de ataques adversarios multimodales para modelos de visión y lenguaje

Los autores presentan PHANTOM, un conjunto de datos abierto y a gran escala que contiene 47.524 ataques adversarios pregenerados diseñados para evaluar la seguridad y robustez de los modelos de visión y lenguaje (VLMs). Este recurso consolida las evaluaciones existentes y las extiende con nuevas categorías para proporcionar datos de evaluación diversos y prácticos para la comunidad investigadora.

arxiv arXiv cs.LG · hace 11 h

Dirección de Variedad Paralela: Adaptación Eficiente de Grandes Memorias Asociativas Mediante Moldeado de Energía Residual

Los autores proponen H-Res (Dirección Residual Jerárquica), un mecanismo que adapta grandes modelos Transformer modulando su paisaje de energía efectivo sin alterar el equilibrio global ni expandir la longitud de la secuencia. Este enfoque formula la adaptación como un problema de control en la variedad de activaciones para dirigir las trayectorias de tokens hacia cuencas de atracción específicas de la tarea.

arxiv arXiv cs.LG · hace 11 h

RE4: Imitación consciente de la transformación de interacciones de objetos utilizando modos de manipulación

Este artículo presenta RE4, un marco para el aprendizaje por imitación que combina teorías fundamentadas de manipulación con benchmarks modernos para preservar tanto el rendimiento como la interpretabilidad en tareas de interacción con objetos. El enfoque utiliza estimación de pose ligera y auto-supervisada, junto con transformaciones conscientes del modo, para recuperar y replanificar demostraciones de manera efectiva.

arxiv arXiv cs.LG · hace 12 h

Identificadores naturales para privacidad y auditorías de datos en modelos de lenguaje grandes

Este trabajo introduce identificadores naturales (NIDs), que son cadenas aleatorias estructuradas como hashes criptográficos y URLs acortadas encontradas en los datos de entrenamiento de LLM, para abordar los desafíos de auditar la privacidad de los modelos de lenguaje grandes. Los NIDs permiten auditorías escalables de privacidad diferencial post-hoc sin costoso reentrenamiento y facilitan la inferencia de conjuntos de datos sin requerir conjuntos de datos privados retenidos.

arxiv arXiv cs.LG · hace 12 h

MedPCFM: Mejora de la finalización de nubes de puntos médicos mediante la integración de Transformers de puntos y coincidencia de flujos

Este artículo presenta PCFM, un enfoque de coincidencia de flujos para la finalización de nubes de puntos médicas que integra Point Transformer v3 (PTv3) con modelado generativo de tiempo continuo. El método se evalúa en los conjuntos de datos SkullFix, SkullBreak y Mandibular Defect para evaluar su rendimiento en tareas de reconstrucción anatómica.

arxiv arXiv cs.LG · hace 12 h

Modelo de Aprendizaje Automático Agnóstico de la Habitabilidad Fotosintética

Los investigadores han desarrollado un modelo agnóstico para la Zona Habitable Fotosintética (PHZ) basado en termodinámica y química redox, eliminando los sesgos antropocéntricos encontrados en estimaciones anteriores. Al optimizar una reacción fotoquímica genérica contra espectros de irradiación de exoplanetas utilizando un algoritmo genético, el estudio predice que la viabilidad fotosintética disminuye linealmente con la distancia orbital en lugar de cuadráticamente.

arxiv arXiv cs.LG · hace 12 h

Transformador de dos etapas basado en LLM para el diagnóstico de fallos en rodamientos

Este artículo propone un marco de aprendizaje por transferencia de dos etapas guiado por conocimiento para abordar los desafíos del diagnóstico de fallos en rodamientos que involucran heterogeneidad de conjuntos de datos, variaciones en las condiciones de operación y datos etiquetados limitados. El enfoque utiliza un Transformador ligero estilo GPT-2 con autoatención causal para la extracción jerárquica de características a partir de señales de vibración.

arxiv arXiv cs.LG · hace 12 h

CrossPool: Servicio eficiente de múltiples LLM para modelos MoE en frío mediante la disgregación de KV-Cache y pesos

CrossPool es un motor de servicio diseñado para modelos Mixture-of-Experts (MoE) en frío que aborda las ineficiencias de memoria GPU separando los pesos FFN y el KV-cache en pools distintos. Esta disgregación permite al sistema consolidar los pesos estáticos mientras aprovisiona dinámicamente la demanda activa de KV-cache, superando las limitaciones de la asignación monolítica de memoria.

arxiv arXiv cs.LG · hace 12 h

Una evaluación justa de los Modelos Fundacionales de Grafos para la Predicción de Propiedades de Nodos

Este estudio realiza una reevaluación rigurosa de nueve Modelos Fundacionales de Grafos (GFMs) recientes para la predicción de propiedades de nodos con el fin de abordar la falta de estándares de evaluación unificados en el campo. Los autores comparan estos modelos contra puntos de referencia sólidos de Redes Neuronales de Grafos (GNN) para determinar su rendimiento relativo y eficiencia.

arxiv arXiv cs.LG · hace 12 h

El razonamiento como dinámica de atractores: Recuperación de memoria latente mediante minimización de energía ponderada por Gibbs

Este artículo reinterpreta los Modelos de Lenguaje Grandes como Memorias Asociativas Densas de alta dimensión donde el razonamiento correcto corresponde a cuencas de atracción profundas en el paisaje de energía. Los autores introducen un mecanismo de recuperación que muestrea múltiples trayectorias de razonamiento y las pondera por energía inversa para aproximar la distribución de equilibrio.

arxiv arXiv cs.LG · hace 12 h

EERLoss: Una nueva función de pérdida para entrenar modelos biométricos profundos

Este artículo presenta EERLoss, una aproximación subdiferenciable de la Tasa de Error Igual (EER) diseñada para alinear el entrenamiento de modelos biométricos profundos con las métricas de evaluación principales. Validado en la verificación de dinámica de tecleo utilizando el benchmark KVC-onGoing, el enfoque aborda la desalineación entre los objetivos de optimización y la evaluación del rendimiento.

arxiv arXiv cs.LG · hace 12 h

QC-SMOTE: SMOTE con control de calidad para clasificación desbalanceada

Los autores proponen QC-SMOTE, un marco de sobremuestreo con control de calidad diseñado para abordar la generación de muestras sintéticas de baja calidad en regiones ruidosas o superpuestas comunes en tareas de clasificación desbalanceada. Este método estima la fiabilidad de las muestras minoritarias utilizando una puntuación compuesta de confianza del vecindario y emplea una estrategia best-of-K guiada por IPQ para generar candidatos sintéticos.

arxiv arXiv cs.LG · hace 12 h

ASALT: Alineación adaptativa del estado para transferencia lateral en aprendizaje por refuerzo multiagente

Este artículo presenta ASALT, un método que permite el aprendizaje de transferencia lateral en aprendizaje por refuerzo multiagente al acomodar las discrepancias en la dimensionalidad del espacio de estados entre los dominios de origen y destino. El enfoque utiliza adaptadores a nivel de observación y a nivel de estado para mapear las entradas en un espacio de incrustación compartido, facilitando una transferencia efectiva del conocimiento entre entornos heterogéneos.