Todos los artículos
arxiv arXiv cs.AI · hace 5 h

Female-RHINO: Marco integrado en tiempo real con escáneres para análisis automatizado de RM uterina

Este artículo presenta Female-RHINO, un marco asistido por IA en tiempo real que se integra con escáneres de RM para realizar análisis cuantitativo automatizado del útero y generación de informes estructurados durante la adquisición de imágenes. El sistema combina modelos de aprendizaje profundo para segmentación y detección de puntos de referencia, derivando biomarcadores a partir de resonancias magnéticas pélvicas sagitales ponderadas en T2 sin interacción manual.

arxiv arXiv cs.AI · hace 5 h

IA Agéntica para la Optimización Bínivel de Largo Plazo en Sistemas de Capa Física Basados en Políticas

Este artículo presenta Agentic-LTPO, un marco de optimización bínivel anidado diseñado para abordar las limitaciones de los métodos de objetivo fijo en sistemas de capa física que enfrentan políticas de operador dinámicas y restricciones en tiempo real. El marco utiliza IA agéntica para generar configuraciones de nivel superior que traducen las políticas evolutivas y la experiencia histórica en problemas estructurados de nivel inferior para la toma de decisiones inmediata.

arxiv arXiv cs.AI · hace 6 h

Detección de agentes de codificación de IA en código abierto: un censo validado y multimétodo de 180 millones de repositorios

Un marco de detección multicapa que analiza 180 millones de repositorios Git revela que los métodos de señal única subestiman significativamente la prevalencia de agentes de codificación de IA generativa, omitiendo hasta el 97% de la actividad. El estudio identifica más de 320.000 commits por mes de agentes como Claude Code, que domina la adopción silenciosa a través de archivos de configuración en lugar de cuentas de bot.

arxiv arXiv cs.AI · hace 6 h

MedPCFM: Mejora de la finalización de nubes de puntos médicos mediante la integración de Transformers de puntos y coincidencia de flujos

Este artículo presenta PCFM, un enfoque de coincidencia de flujos para la finalización de nubes de puntos médicas que integra Point Transformer v3 (PTv3) para abordar la modelación generativa insuficientemente estudiada en este dominio. El método se evalúa en los conjuntos de datos SkullFix, SkullBreak y Mandibular Defect frente a bases fuertes deterministas y de difusión.

arxiv arXiv cs.AI · hace 6 h

ReM-MoA: La memoria de razonamiento sostiene la escalabilidad de Mixture-of-Agents

Los autores proponen ReM-MoA, un marco de trabajo Mixture-of-Agents aumentado con memoria diseñado para sostener las ganancias de rendimiento a medida que aumenta la profundidad del modelo, abordando los problemas de degradación y saturación encontrados en variantes existentes. El sistema utiliza una Memoria de Razonamiento Clasificada y un esquema de Enrutamiento de Memoria Diversa Curada para preservar la diversidad de exploración mientras se propagan trazas de razonamiento de alta calidad a través de las capas.

arxiv arXiv cs.AI · hace 6 h

NoContactNoWorries: Estimación del contacto mediante visión y propiocepción para manipulación diestra en la mano

Los investigadores proponen NoContactNoWorries, un marco basado en transformadores que infiere estados de contacto binarios durante la manipulación en la mano fusionando visión RGB-D con propiocepción del robot. Este enfoque sirve como una señal pseudo-táctil escalable, evitando el costo y la fragilidad asociados con sensores táctiles de hardware dedicados.

arxiv arXiv cs.AI · hace 7 h

El impuesto del lenguaje africano: cuantificar el costo, la latencia y la penalización por contexto de tokenizar lenguas africanas en LLMs de vanguardia

Un estudio cuantifica la penalización estructural de tokenización que enfrentan las lenguas africanas en modelos de lenguaje grandes comerciales, revelando que los hablantes pagan costos más altos y experimentan mayor latencia debido a una asignación ineficiente de subpalabras. Entre 20 lenguas africanas y 11 tokenizadores de vanguardia, cada lengua evaluada incurre en un sobreprecio respecto al inglés, con costos medianos que alcanzan 1.88 veces los del inglés y hasta 8.92 veces para el guion N'Ko.

arxiv arXiv cs.AI · hace 7 h

CompressKV: Compresión de caché KV guiada por recuperación semántica para inferencia eficiente en recursos de LLM de contexto largo

Los autores proponen CompressKV, un marco que comprime las cachés de clave-valor en modelos de lenguaje grandes basados en GQA identificando cabezales de recuperación semántica para retener tokens críticos. Este enfoque aborda la degradación del rendimiento causada por los métodos de desalojo heurísticos existentes que ignoran las funcionalidades distintas de los cabezales de atención.