Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 108

SAFER: Agrupación adaptativa guiada por fiabilidad para la adaptación en tiempo de prueba robusta

Los autores abordan la fragilidad de la adaptación en tiempo de prueba (TTA) bajo flujos contaminados adversarialmente proponiendo SAFER, un marco sin entrenamiento para TTA robusta. SAFER actúa como un envoltorio de augmentación que reemplaza las predicciones de vista única con un predictor agrupado guiado por fiabilidad para estabilizar las actualizaciones en línea. Para cada muestra de prueba, el método genera augmentaciones estocásticas y agrega sus salidas utilizando agrupamiento ponderado por correlación combinado con detección de valores atípicos. También se introduce una extensión de mezcla adaptativa, que ajusta la ponderación entre entradas originales y aumentadas basándose en señales de desacuerdo de características para preservar el rendimiento limpio. Los investigadores evaluaron SAFER en los benchmarks PACS, VLCS y OfficeHome bajo ataques PGD a varias tasas. Los resultados indican que SAFER mejora la resiliencia de los métodos TTA contra ataques adversariales mientras mantiene una precisión competitiva en datos limpios.

SAFER: Agrupación adaptativa guiada por fiabilidad para la adaptación en tiempo de prueba robusta

El aprendizaje de diccionarios activados parcimoniosamente vincula la dispersión y el almacenamiento con los modelos generativos

ORBIT: Dirección de comportamiento multiatributo sin entrenamiento mediante rotación de subespacio ortogonal

Evaluación sin referencia de la consistencia física en la generación de video basada en modelos del mundo

Muestreo de posteriores con annealing de flujo para regresión en espacio de funciones y problemas inversos

Script para monitorear llama cpp y analizar el uso de memoria

Actualización de Ornith-1.0-35B GGUF: injerto nativo de descodificación especulativa MTP + métricas completas de servicio/TTFT/contexto largo (llama.cpp, tp=1)

Kiwano: Un kit de herramientas PyTorch de código abierto para la investigación en verificación del hablante

Entrenamiento Multirred para Generación Molecular usando Redes Neuronales Gráficas

HyperAdapter: Adaptación de hiperaristas estructuradas para el ajuste fino eficiente en parámetros de transformadores de visión

CNN eficiente con aprendizaje por transferencia para detección de múltiples cánceres

P4IR: El aprendizaje por refuerzo mejora los sistemas automatizados de cumplimiento de código

Recuperación del subespacio de señal asintótica en modelos de atención softmax

QeHDC: Computación hiperdimensional basada en enlace mejorado por cuántica y construcción de SuperClase

GaRA: Generación de LoRA consciente del grafo para mejorar LLMs en tareas de grafos

Los LLMs Determinan la Estructura Causal Mediante Lógica de Hacer Diferencia

Escapando de la Trampa de la Varianza: Dinámica Libre de Jacobiano para Optimización Bínivel de Búsqueda de Raíces

RQ-TTSA: Optimización bilevel robusta consciente de la distribución con actualizaciones Huber guiadas por cuantiles

Un VCS de Atari diferenciable para IA explicable

Deezer implementa un sistema de generación de descripciones para listas de reproducción basado en LLM