Todos los artículos
arxiv arXiv cs.AI · hace 9 h

Acelerando el RL desagregado para LLMs visuales generativos con paralelismo basado en difusión

Los investigadores presentan DigenRL, un marco de aprendizaje por refuerzo desagregado diseñado para abordar las ineficiencias de la ejecución colocalizada en modelos de lenguaje grande generativos basados en difusión. El sistema admite asignación flexible de recursos y GPUs heterogéneas mientras utiliza técnicas de paralelismo novedosas para reducir las burbujas de ejecución.

arxiv arXiv cs.AI · hace 9 h

Cuando la utilidad supera la precaución causal: Supresión y recuperación dependientes del contexto en los LLM

Un estudio revela que los modelos de lenguaje grandes suprimen sistemáticamente la 'Precaución Causal'—la tendencia a abstenerse de emitir juicios causales sin evidencia suficiente—al pasar de contextos académicos a contextos de asesoramiento práctico. Esta supresión ocurre a pesar de que los modelos conservan la capacidad subyacente, como lo demuestra la habilidad de restaurar el razonamiento cauteloso mediante prompts específicos.

arxiv arXiv cs.AI · hace 9 h

Convoluciones de Kolmogorov-Arnold Estructurales: Función aprendible en los valores o la forma del filtro

El artículo introduce Redes de Kolmogorov-Arnold Estructurales (KANs) que colocan funciones aprendibles en la estructura de convolución en lugar de en las entradas individuales del kernel, organizando el diseño según si la función actúa sobre los valores de píxel o la forma del filtro. Presenta tres realizaciones: SV-KAN con una función de valor compartida, AG-KAN usando un adaptador gaussiano adaptativo al contenido, y RF-KAN que construye filtros a partir de perfiles de cresta orientados en una base de wavelet Morlet.

arxiv arXiv cs.AI · hace 9 h

Explicación neural consistente en ciclo de certificados de verificación formal

Los investigadores proponen una arquitectura neural consistente en ciclo que genera explicaciones en lenguaje natural fieles para certificados de verificación formal, abordando la opacidad de estas pruebas verificables por máquina para no especialistas. El sistema alcanza una solidez verificada en ciclo del 90.0% en datos de prueba de un dominio de cumplimiento financiero, superando significativamente a las líneas base multi-LLM tanto en precisión como en velocidad de inferencia.

arxiv arXiv cs.AI · hace 10 h

PHANTOM: Un conjunto de datos a gran escala de ataques adversarios multimodales para modelos de visión y lenguaje

Los investigadores han presentado PHANTOM, un conjunto de datos a gran escala y de código abierto que contiene 47.524 ataques adversarios pregenerados diseñados para evaluar la seguridad y robustez de los modelos de visión y lenguaje (VLMs). Este recurso consolida y amplía benchmarks anteriores al cubrir 10 categorías de alto nivel y 55 subcategorías de intenciones dañinas, con el objetivo de reducir las barreras computacionales para la investigación adversarial.

arxiv arXiv cs.AI · hace 10 h

Female-RHINO: Marco integrado en tiempo real con escáneres para análisis automatizado de RM uterina

Este artículo presenta Female-RHINO, un marco asistido por IA en tiempo real que se integra con escáneres de RM para realizar análisis cuantitativo automatizado del útero y generación de informes estructurados durante la adquisición de imágenes. El sistema combina modelos de aprendizaje profundo para segmentación y detección de puntos de referencia, derivando biomarcadores a partir de resonancias magnéticas pélvicas sagitales ponderadas en T2 sin interacción manual.

arxiv arXiv cs.AI · hace 10 h

IA Agéntica para la Optimización Bínivel de Largo Plazo en Sistemas de Capa Física Basados en Políticas

Este artículo presenta Agentic-LTPO, un marco de optimización bínivel anidado diseñado para abordar las limitaciones de los métodos de objetivo fijo en sistemas de capa física que enfrentan políticas de operador dinámicas y restricciones en tiempo real. El marco utiliza IA agéntica para generar configuraciones de nivel superior que traducen las políticas evolutivas y la experiencia histórica en problemas estructurados de nivel inferior para la toma de decisiones inmediata.

arxiv arXiv cs.AI · hace 11 h

Detección de agentes de codificación de IA en código abierto: un censo validado y multimétodo de 180 millones de repositorios

Un marco de detección multicapa que analiza 180 millones de repositorios Git revela que los métodos de señal única subestiman significativamente la prevalencia de agentes de codificación de IA generativa, omitiendo hasta el 97% de la actividad. El estudio identifica más de 320.000 commits por mes de agentes como Claude Code, que domina la adopción silenciosa a través de archivos de configuración en lugar de cuentas de bot.

arxiv arXiv cs.AI · hace 11 h

MedPCFM: Mejora de la finalización de nubes de puntos médicos mediante la integración de Transformers de puntos y coincidencia de flujos

Este artículo presenta PCFM, un enfoque de coincidencia de flujos para la finalización de nubes de puntos médicas que integra Point Transformer v3 (PTv3) para abordar la modelación generativa insuficientemente estudiada en este dominio. El método se evalúa en los conjuntos de datos SkullFix, SkullBreak y Mandibular Defect frente a bases fuertes deterministas y de difusión.