Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 99

Búsqueda Simbólica Agéntica para la Caracterización de Soluciones de EDP

ASYS propone un marco guiado por previos que utiliza teoría matemática y búsqueda evolutiva para generar formas simbólicas interpretables de soluciones de EDP. Produce representaciones analíticas para problemas complejos como la dinámica de Allen-Cahn y el blow-up de Keller-Segel, ofreciendo nuevas vías para el análisis matemático más allá de los métodos tradicionales.

arxiv arXiv cs.LG · hace 2 h

La nitidez riemanniana explica el sesgo de SGD hacia mínimos planos

Este estudio introduce la nitidez riemanniana, una medida de planitud invariante a reparametrizaciones basada en la geometría de la Matriz de Información de Fisher. Demuestra que la distribución estacionaria de SGD se concentra en mínimos riemannianamente planos y vincula este sesgo geométrico con la generalización mediante un límite PAC-Bayes. Los experimentos en MNIST y CIFAR-10 muestran que la nitidez riemanniana rastrea mejor la generalización que la nitidez euclidiana, con un escalado consistente con la teoría.

arxiv arXiv cs.LG · hace 2 h

UltraQuant: Caché KV de 4 bits para agentes con alta carga de contexto

UltraQuant introduce un método de caché KV de 4 bits diseñado para cargas de trabajo de agentes con alta demanda de contexto. Logra una reducción de 3.47x en el tiempo P50 hasta el primer token en rondas tardías y un aumento de 1.63x en el rendimiento de salida en comparación con el caché KV FP8, utilizando consultas FP8, tensores KV FP4 y soporte nativo AMD CDNA4 para scaled-MFMA.

arxiv arXiv cs.AI · hace 2 h

Modelos de base EEG para la detección de supresión por ráfagas en UCI

Un estudio evalúa Modelos de base EEG para la detección de supresión por ráfagas basada en eventos en entornos de UCI sin calibración específica del paciente. REVE-base logró la puntuación F1 basada en eventos más alta de 0.868 y redujo el error de ráfagas por minuto en un 52.1% en comparación con EEGNet y un 36.2% en comparación con la umbralización adaptativa, demostrando un rendimiento superior. Los resultados de ablation muestran que el ajuste fino completo supera a otras estrategias, y REVE-base preentrenado supera la inicialización aleatoria por 0.723 puntos F1 con el 25% de datos etiquetados, destacando el valor del preentrenamiento para conjuntos de datos limitados.

Búsqueda Simbólica Agéntica para la Caracterización de Soluciones de EDP

La nitidez riemanniana explica el sesgo de SGD hacia mínimos planos

UltraQuant: Caché KV de 4 bits para agentes con alta carga de contexto

Modelos de base EEG para la detección de supresión por ráfagas en UCI

Acumulación de Ventaja Marginal para la Autoevolución de Agentes Impulsada por Memoria

El conjunto de datos RefRad2D permite la fundamentación espacial escalable en radiología

Alineación de LLM mediante Retroalimentación Implícita del Usuario

Propagación del sesgo del evaluador en sistemas de LLM multi-agente

Estimación de entropía en sistemas multiqutrit con redes neuronales

Cómo los LLM alineados con la seguridad interpretan demostraciones mixtas de cumplimiento

El ajuste de prueba y refinamiento mejora el rendimiento de los agentes de codificación

Corredor de Ejecución Soberana para Control Agéntico Vinculado a Certificados

Cápsulas de estado de ejecución para inferencia de IA en dispositivo con baja latencia

Marco de Aprendizaje In-Contexto Bayesiano Multi-Tarea

Calibración en modelos MoE bajo cambio de distribución

La previsibilidad como medida de gran detalle para la privacidad

Atención de Álgebra de Lie: Tokens de Elementos de Grupo en Redes Neuronales

Multicalibración determinista con complejidad de muestra óptima

UNIEGO: Representación egocéntrica unificada mediada por proxy

¿Qué tan transparente es DiffusionGemma?