Todos los artículos
arxiv arXiv cs.AI · hace 2 h

QBioFusion-QSAR: Aprendizaje de núcleos cuánticos para la clasificación de ligandos con datos pequeños

QBioFusion-QSAR integra un núcleo de fidelidad cuántica con huellas digitales Morgan/Tanimoto para mejorar la clasificación de ligandos. En el benchmark PsychLight-A, QMKL aumentó la precisión y MCC en comparación con solo Morgan/Tanimoto, con mejoras atribuidas a mejores predicciones de moléculas con acantilados de actividad, como N-Me-5-HT y N-Me-tryptamina. El análisis auditable confirma contribuciones localizadas del núcleo cuántico en configuraciones de datos pequeños.

arxiv arXiv cs.AI · hace 2 h

FleetAgent: Teleoperación eficiente para flotas autónomas

FleetAgent es un modelo de lenguaje grande multimodal alojado en la nube que procesa mensajes compactos vectorizados de vehículo a red para habilitar una teleoperación eficiente y explicable. Reduce la carga útil de enlace ascendente hasta 625 veces y la memoria KV-cache 625 veces en comparación con imágenes o texto sin procesar, y supera a Qwen2.5-VL-7B en Lingo-Judge y tasas de fallo de intervención en el conjunto de datos VecEval.

arxiv arXiv cs.AI · hace 2 h

Estudio empírico de la cuantización OpenPangu en NPUs Ascend

Un estudio controlado evalúa los modelos OpenPangu 1B y 7B en NPUs Huawei Ascend 910B1 utilizando métodos de cuantización solo de pesos y de pesos-activación. Los resultados muestran que la cuantización solo de pesos de 8 bits es sin pérdidas para ambos modelos, mientras que la cuantización de 4 bits es práctica para el modelo 7B pero perjudicial para el 1B en tareas de razonamiento, matemáticas y código. Los métodos de ultra baja precisión como 2 bits y binarios fallan, y W4A4 SmoothQuant produce una perplejidad no finita, lo que indica que la compresión extrema de pocos bits sigue siendo un desafío.

arxiv arXiv cs.AI · hace 2 h

ARCO: Rúbrica adaptativa con coevolución para agentes LLM de múltiples pasos

ARCO introduce un marco de rúbricas que permite la asignación de crédito a nivel de paso para agentes LLM de múltiples pasos. Actualiza conjuntamente un modelo compartido con cabezales de generación y puntuación, permitiendo que el contenido de la rúbrica y la función de puntuación coevolucionen mediante datos on-policy, mejorando el rendimiento y la interpretabilidad en benchmarks.

arxiv arXiv cs.AI · hace 2 h

FastGAN y modelos de transformador mejoran la detección de pulgones en habas

Un estudio utiliza FastGAN para generar 10.000 imágenes hiperespectrales sintéticas de hojas de haba, preservando las características espectrales y estructurales reales. Los modelos basados en transformadores, particularmente Vision Transformer, logran la mayor precisión y puntuaciones F1 en la clasificación de hojas sanas frente a hojas infestadas por pulgones, superando a los CNN clásicos y demostrando una mejor detección de enfermedades con reducción de falsos negativos.

arxiv arXiv cs.AI · hace 2 h

Explicaciones basadas en influencia para la evaluación de la severidad de la disartria

Un nuevo marco proporciona explicaciones a nivel de instancia para la evaluación de la severidad de la disartria identificando muestras de entrenamiento que apoyan y compiten. Utilizando puntuaciones de influencia basadas en gradientes, vincula las decisiones del modelo con casos de referencia perceptibles, permitiendo predicciones auditables e interpretables mediante experimentos de eliminación controlada.

arxiv arXiv cs.AI · hace 2 h

TASER: Expansión de Habilidades Diferenciadas por Tarea para Aprendizaje Continuo Heterogéneo

TASER presenta un marco que expande y enruta dinámicamente habilidades atómicas para el aprendizaje continuo en tareas altamente heterogéneas. Reduce el olvido catastrófico y mejora la plasticidad garantizando la distinción semántica y la asignación eficiente de capacidad mediante mecanismos de detección y enrutamiento de habilidades. Evaluado en HeteroCLBench, un conjunto de pruebas con 19 tareas diversas en 9 dimensiones cognitivas, TASER supera a las líneas base existentes.

arxiv arXiv cs.AI · hace 2 h

Las etiquetas de advertencia cambian las percepciones pero no la influencia de la IA en la adulación

Un estudio con 2.610 participantes encontró que revelar que una IA es aduladora altera las percepciones de los usuarios sobre su objetividad y confianza. Sin embargo, dichas etiquetas no reducen la creencia de los usuarios en su propia razón ni su disposición a resolver conflictos. Los resultados indican que las etiquetas de advertencia afectan la percepción sin reducir la influencia real, lo que sugiere una brecha entre la percepción y el comportamiento.

arxiv arXiv cs.AI · hace 2 h

DataClaw0: Adaptación Agéntica de Datos Multimodales a partir de Flujos en Bruto

DataClaw0 introduce un paradigma agéntico para refinar activamente datos multimodales y alinearlos con las intenciones del usuario y de tareas posteriores. Utiliza una tubería de dos etapas con anclajes factuales para generar un conjunto de datos a gran escala en cinco dominios y logra una fuerte alineación mediante ajuste fino supervisado y GRPO. Evaluado en generación de video, VQA y navegación GUI, DataClaw0 produce datos de alta densidad de información, permitiendo una adaptación eficiente del modelo con mínimos datos de entrenamiento.

arxiv arXiv cs.AI · hace 2 h

Los modelos de Transformer son altamente sensibles a datos ruidosos en la predicción de trayectorias

Un estudio descubre que los modelos de predicción de trayectorias basados en Transformer se degradan significativamente con datos de estado de objetos ruidosos. La precisión disminuye 1.3x bajo ruido leve y hasta 3.9x bajo condiciones de ruido alto realistas, destacando su sensibilidad y la necesidad de datos de entrenamiento más ruidosos y del mundo real, así como estrategias de mitigación.

arxiv arXiv cs.AI · hace 2 h

SOHET: Transformador Auto-supervisado para Flujos de Eventos Heterogéneos

SOHET introduce una arquitectura de transformador jerárquica con codificadores tabulares específicos por tipo de evento y objetivos de pre-entrenamiento auto-supervisados. Supera a los métodos existentes en un 5.8% en la tarea de detección de fraude de Booking.com y logra una convergencia más rápida con una ganancia adicional del 2.4% del pre-entrenamiento. En el benchmark EBES, SOHET bidireccional iguala o supera los mejores resultados publicados en seis de las ocho tareas.

arxiv arXiv cs.AI · hace 2 h

LambdaMark: Primer esquema genérico de marca de agua de audio radiactivo

LambdaMark introduce el primer esquema genérico de marca de agua de audio radiactivo que incrusta mensajes de múltiples bits en representaciones latentes semánticas de audio. Logra robustez frente a distorsiones y ataques de eliminación adversarial, y sigue siendo efectivo incluso en voz generada por modelos ajustados finamente, ofreciendo una defensa sólida contra la clonación de voz y la suplantación de identidad.

arxiv arXiv cs.AI · hace 2 h

El modelo de aprendizaje automático predice pólipos colorrectales de alto riesgo en afroamericanos

Un modelo de aprendizaje automático desarrollado utilizando características clínicas previas a la colonoscopia predice pólipos colorrectales de alto riesgo en afroamericanos. El modelo, validado en una cohorte urbana diversa, utiliza datos demográficos, de estilo de vida y de comorbilidades para identificar pacientes con mayor riesgo, con validación externa realizada en 2023-2024.