Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 104

Destilando Transformers en Recurrent Transformers para Memoria Eficiente

Un nuevo método de destilación transfiere la estrategia de compresión de observaciones de los transformers de historial completo a modelos recurrentes. Al entrenar un modelo maestro para comprimir las historias de observaciones en cuellos de botella de tamaño fijo, el enfoque alinea la memoria del estudiante con la compresión del maestro. Esto permite que los recurrent transformers logren rendimiento cercano al de historial completo con complejidad de tiempo lineal, haciéndolos viables para aplicaciones de robótica a largo plazo.

arxiv arXiv cs.LG · hace 3 h

LIG: Gradientes Integrados por Capa para Análisis de Flujo en Transformers

LIG extiende los Gradientes Integrados a mapas conjunto-a-conjunto en Transformers, permitiendo la atribución a nivel de token dentro de las capas. Analiza la consistencia de la atribución módulo por módulo y a lo largo de toda la capa, y rastrea el flujo de información mediante contribuciones separadas de atención y MLP, utilizando como líneas base la incrustación del token objetivo y salidas con cero o atención nula. LIG opera en los límites de los módulos sin necesidad de reentrenamiento ni intérpretes personalizados, ofreciendo una herramienta XAI de diagnóstico para los componentes internos de Transformers.

arxiv arXiv cs.LG · hace 3 h

Geometría del costo de la creencia en inferencia ruidosa

Un modelo de inferencia de máquina finita utiliza geometría de costos para cuantificar transiciones de creencia, combinando transporte óptimo con información de Fisher. El marco revela un muro, honestidad y rigidez en los espacios de creencia, con la creencia gaussiana logrando la máxima curvatura hiperbólica. La termodinámica establece la unidad de costo, y el piso geométrico de precisión diverge en la certeza, con el valor -1/4 representando una escala clave.

arxiv arXiv cs.LG · hace 3 h

FAST: Un marco para muestreo alineado y entrenamiento en aprendizaje por refuerzo paralelo

FAST aborda la ineficiencia del muestreo en el aprendizaje por refuerzo para conducción autónoma introduciendo Alineación de Muestreo Paralelo Dinámico para desacoplar la terminación del episodio de los bucles de muestreo. Logra una aceleración de hasta 1.78 veces en tiempo real frente a las líneas base de un solo clip, mientras mantiene la ausencia de sesgo estadístico mediante Optimización de Relleno de Máscara Escalada.

Destilando Transformers en Recurrent Transformers para Memoria Eficiente

LIG: Gradientes Integrados por Capa para Análisis de Flujo en Transformers

Geometría del costo de la creencia en inferencia ruidosa

FAST: Un marco para muestreo alineado y entrenamiento en aprendizaje por refuerzo paralelo

MedLayXPlain: Evaluando la brecha entre expertos y no expertos en modelos de visión y lenguaje médicos

Referencia basada en perfiles en el anclaje de LLM

Extracción y análisis de conceptos multimodales en modelos de lenguaje y visión

Denuncias de máquinas: Un enfoque normativo y fundamentado

La distancia lingüística afecta el consenso en autómatas celulares neuronales

Ilusiones de coherencia en LLMs holandeses reveladas

QBioFusion-QSAR: Aprendizaje de núcleos cuánticos para la clasificación de ligandos con datos pequeños

Mejora de la verificación de hablante para vocalizaciones no verbales

FleetAgent: Teleoperación eficiente para flotas autónomas

Caché de KV adaptativo a la recencia/frecuencia para el servicio de LLM

ACE-GS: Splatting Gaussiano 3D eficiente y preciso

Estudio empírico de la cuantización OpenPangu en NPUs Ascend

ARCO: Rúbrica adaptativa con coevolución para agentes LLM de múltiples pasos

FastGAN y modelos de transformador mejoran la detección de pulgones en habas

Dinámica Neural Topológica: Modelado de Secuencias por Neurona

Explicaciones basadas en influencia para la evaluación de la severidad de la disartria