Todos los artículos
media Latent Space · hace 2 h

Midjourney lanza un escáner de ultrasonido y TC de cuerpo completo

Midjourney ha anunciado un escáner de ultrasonido y TC de cuerpo completo, calificándolo como la primera nueva modalidad de imagen médica de cuerpo entero en 50 años. El prototipo, conocido como Midjourney Scanner, utiliza 8.960 transductores distribuidos en 40 sistemas dentro de un anillo de 70 cm para capturar datos a 17 GB/s, con una resolución declarada de hasta 0,5 mm y un objetivo de 358.000 elementos ultrasónicos. El sistema se encuentra actualmente en la Gen 1, con escaneos que toman 20 minutos y sin uso de IA en la generación de imágenes aún, aunque las futuras versiones buscan integrar IA y alcanzar 50.000 escáneres al permitir 1.000 millones de escaneos mensuales.

arxiv arXiv cs.LG · hace 2 h

El RL guiado por discriminador corrige el emparejamiento de flujos con recompensas alineadas a los datos

El RL guiado por discriminador (DRL) utiliza un espacio de representaciones preentrenado para entrenar un discriminador que separa los datos reales de las muestras generadas por el modelo. Su logit se usa como recompensa en el RL con regularización KL, alineando las salidas del modelo con la realismo visual y semántico sin preferencias humanas. DRL mejora FID y FD semántico en modelos como SiT y JiT, y mejora la frontera de Pareto entre preferencia y fidelidad.

arxiv arXiv cs.LG · hace 2 h

Preentrenamiento de Reflexión de Seguridad para LLMs

El Preentrenamiento de Reflexión de Seguridad inserta breves reflexiones de seguridad en los datos de preentrenamiento para habilitar la auto-monitoreo en modelos de lenguaje. Los experimentos con modelos de 1.7B en FineWeb-Edu muestran una mayor precisión de seguridad y tasas reducidas de éxito de ataque, con MedSafetyWorld demostrando que el método previene mejor que la filtración o reescritura de datos que los comportamientos inseguros se generalicen a partir de datos seguros.

arxiv arXiv cs.LG · hace 2 h

Act2Answer evalúa la retención de conocimiento en modelos de visión-lenguaje-acción

Act2Answer introduce un protocolo ligero para evaluar la retención de conocimiento del sentido común y del mundo en modelos VLA, requiriendo que los agentes respondan preguntas mediante acciones de colocación de objetos. Un estudio a gran escala de 7 modelos VLA y 9 líneas base VLM revela que los VLA funcionan bien en conceptos simples pero muestran brechas mayores en categorías semánticas ricas en comparación con sus VLMs fuente, con el co-entrenamiento VQA mejorando la retención de conocimiento y señales pico relevantes para la respuesta observadas en las capas intermedias de VLA.

arxiv arXiv cs.LG · hace 3 h

Compensaciones del tamaño de lote en métodos de momento estocástico

Los métodos de momento estocástico como HB y ASGD muestran compensaciones distintas del tamaño de lote en eficiencia computacional y tiempo de ejecución secuencial. HB mantiene la eficiencia computacional a nivel de SGD en una ventana de tamaño de lote hasta un factor \sqrt{\kappa} mayor que el tamaño crítico de lote de SGD, mientras que ASGD mejora la eficiencia para lotes pequeños en espectras que decaen rápidamente pero la sacrifica para lotes más grandes a cambio de reducir el tiempo de ejecución secuencial.

arxiv arXiv cs.LG · hace 3 h

AUC entre conjuntos de datos para la evaluación realista de detectores de deepfake

Una nueva métrica, AUC entre conjuntos de datos (Cross-AUC), aborda las limitaciones de las evaluaciones tradicionales de AUC al promediar los AUC por dominio e incorporar la polarización de las predicciones mediante la Distancia de Wasserstein. Refleja mejor el rendimiento en el mundo real bajo cambios de dominio y proporciona interpretaciones claras sobre la degradación del detector.

arxiv arXiv cs.LG · hace 3 h

AGDN: Resolviendo el problema del viajante con difusión de grafos anisotrópica

AGDN introduce un marco de red neuronal de grafos que aborda los priores topológicos y la pérdida de conectividad en TSP. Utiliza una matriz de transición MixScore y difusión anisotrópica para permitir un intercambio eficiente de información, superando a los métodos existentes en diversos tamaños de problema y distribuciones mientras mantiene un tiempo de cómputo competitivo. La implementación está disponible en GitHub.

arxiv arXiv cs.LG · hace 3 h

Marco de Anotación Automatizada para Disparadores AEB Retardados y Falsos

Un nuevo sistema automatizado aborda el desequilibrio extremo de clases y el ruido asimétrico en las etiquetas de los datos de Frenado Automático de Emergencia. Utiliza aumento de datos dirigido y supresión de ruido para identificar disparadores raros retardados y falsos con un 80% de mejora en la recuperación y una reducción del 50% en el esfuerzo de anotación manual, permitiendo la auto-mejora continua en la optimización del AEB a bordo del vehículo.

arxiv arXiv cs.LG · hace 3 h

RL enfocado en decisiones para carga de vehículos eléctricos con tiempos de salida desconocidos

Un nuevo marco de RL enfocado en entrenamiento conjuntamente un pronosticador y un controlador de carga para manejar tiempos de salida desconocidos de vehículos eléctricos. Al alinear la precisión del pronóstico con la calidad de las decisiones posteriores, el método logra hasta un 14% más de recompensa total y una reducción del 55% en energía no suministrada en comparación con los enfoques estándar de RL.

arxiv arXiv cs.LG · hace 3 h

Geometría de Autovalores Generalizados de Ataques Adversarios Semánticos

Una nueva teoría modela cómo las paráfrasis semánticas pueden engañar a los clasificadores de sentimiento financiero analizando el desplazamiento en el peor caso de las representaciones del modelo objetivo. El índice de atacabilidad λ*(x) se deriva del mayor autovalor generalizado de un lápiz matricial (A,B), ofreciendo predicciones de forma cerrada y certificados de robustez para salidas afines. El marco conecta la teoría de perturbaciones continuas con la búsqueda discreta de paráfrasis, con validación empírica en clasificadores de texto financiero reales.

arxiv arXiv cs.LG · hace 3 h

XGBoost-Forget para el desprendimiento de aprendizaje en la detección de intrusiones de red

XGBoost-Forget permite el desprendimiento de aprendizaje eficiente para modelos XGBoost en conjuntos de datos tabulares de intrusiones de red. Mantiene el rendimiento del modelo mientras logra un desprendimiento más rápido en comparación con el reentrenamiento completo, abordando una brecha en la investigación sobre desprendimiento de aprendizaje para datos tabulares en la detección de intrusiones de red.

arxiv arXiv cs.LG · hace 3 h

MAST permite el olvido selectivo en el razonamiento inducido por RLVR

MAST, un método de olvido guiado por mecanismos, logra el olvido dirigido del razonamiento inducido por RLVR con daños colaterales mínimos. En Qwen2.5-Math-1.5B y Qwen3-1.7B-Base, reduce significativamente el rendimiento en MATH (de 45/150 a 37/15-0) mientras preserva la precisión de GSM8K en +0.8 puntos y mantiene la retención de MATH en -0.5 puntos. Los resultados se mantienen consistentes entre diferentes semillas, objetivos y modelos, mostrando una estabilidad superior frente al olvido de parámetros completos.

arxiv arXiv cs.LG · hace 3 h

Optimización bayesiana con humano en el bucle para restricciones de bioprocesos

Un marco de optimización bayesiana con humano en el bucle extiende el Muestreo Guiado por la Frontera de Pareto al incorporar satisfacción probabilística de restricciones y robustez de entrada como objetivos explícitos. Permite a los expertos del dominio refinar iterativamente los criterios de selección mediante proyecciones interactivas en un tablero de control de las compensaciones entre rendimiento, incertidumbre y viabilidad en la optimización del cultivo de células CHO.

arxiv arXiv cs.LG · hace 3 h

STARE: Reponderación de ventajas a nivel de token guiada por sorpresal para la estabilidad de la entropía de la política

STARE aborda el colapso de la entropía de la política en el aprendizaje por refuerzo basado en GRPO identificando subconjuntos de tokens críticos para la entropía mediante cuantiles de sorpresal y reponderando sus ventajas. Mantiene una entropía de la política estable a través de escalas de modelos y tareas, superando a DAPO y otras líneas base entre un 4% y un 8% en AIME24 y AIME25, con un equilibrio consistente entre exploración y explotación.

arxiv arXiv cs.LG · hace 3 h

TxBench-PP: Rendimiento de Agentes de IA en Farmacología Preclínica

TxBench-PP es una benchmark verificable para farmacología preclínica de moléculas pequeñas, que prueba la capacidad de los agentes de IA para derivar conclusiones precisas a partir de datos de ensayos del mundo real. En 16 configuraciones de model-harness, ningún sistema tomó decisiones de farmacología preclínica correctas de manera confiable, con el mejor rendimiento en 59.3% (Claude Opus 4.8 / Pi) y 55.3% (GPT-5.5 / Pi) de intentos de punto final.

arxiv arXiv cs.LG · hace 3 h

TGO-I: Geometría espectral de los Vision Transformers

TGO-I analiza la geometría espectral de los Vision Transformers utilizando ViT-Small/16 entrenado en ImageNet-100. Revela un aumento en la utilización dimensional y una reducción de la anisotropía, con espectros propios que se vuelven más planos y entropía espectral creciente. El token CLS final muestra la mayor dimensionalidad efectiva y la menor anisotropía, lo que indica una distribución amplia de varianza a través de las dimensiones.

arxiv arXiv cs.LG · hace 3 h

Las redes neuronales gráficas aceleran el solucionador de presión multigrid algebraico

Una red neuronal gráfica mejora los solucionadores multigrid algebraicos al predecir coeficientes polinómicos óptimos para operadores pseudo-inversos dispersos. El método reduce las iteraciones del ciclo V y logra aceleraciones en tiempo real de 4% a 37% en benchmarks, con un rendimiento robusto en mallas hasta 128 veces más grandes que los datos de entrenamiento y en problemas industriales no vistos como AirfRANS.

arxiv arXiv cs.LG · hace 3 h

SCAN: Agrupamiento Multiescala para Detección de Anomalías en Series Temporales

SCAN mejora la detección de anomalías en series temporales basada en reconstrucción mediante la integración de agrupamiento multiescale centrado en el vecindario. Utiliza representaciones del centro del clúster para restringir la reconstrucción de patrones normales y deriva una puntuación de confianza de anomalía basada en la probabilidad de pertenencia al clúster, combinada con el error de reconstrucción. Experimentos extensos en conjuntos de datos reales muestran que SCAN alcanza un rendimiento de vanguardia.