Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 90

Detección de deriva conceptual basada en el aprendiz: Análisis y evaluación

Este estudio analiza y evalúa algoritmos de detección de deriva conceptual a través de múltiples categorías utilizando conjuntos de datos de streaming sintéticos y del mundo real. Examina las características de la deriva y evalúa el rendimiento de los detectores bajo escenarios de deriva abrupta y gradual para mejorar la comprensión del comportamiento de la deriva y la aplicabilidad de los detectores.

arxiv arXiv cs.LG · hace 2 h

MAMO: Sistema Multiagente para Optimización Restringida con Múltiples Objetivos

MAMO introduce un enfoque de aprendizaje por refuerzo multiagente para abordar el desafío de equilibrar la minimización de costos y la satisfacción de restricciones en entornos dinámicos. Desacopla la ejecución de tareas de la selección de pesos de recompensa, tratando la elección de pesos como un problema de aprendizaje para permitir soluciones más autónomas y robustas.

arxiv arXiv cs.LG · hace 2 h

Moldeado de Incrustaciones de Frontera para el Desenredo Estructural de Grafos

El Moldeado de Incrustaciones de Frontera (BES) aborda el entrelazamiento estructural de grafos suprimiendo selectivamente las correlaciones espurias de vecinos cerca de las fronteras de clase. BES utiliza aprendizaje contrastivo adaptativo para mejorar la discriminación de fronteras, mejorando la clasificación de nodos GCN en un promedio del 3.3% (hasta un 5.0% en WikiCS) y logrando una precisión superior en la predicción de enlaces.

media Hugging Face Forums · hace 2 h

El usuario solicita la recuperación de la cuenta para zhoucantd

Un usuario en los foros de Hugging Face está preguntando si es posible recuperar su cuenta, identificando específicamente el nombre de usuario "zhoucantd". La publicación indica un hilo de discusión que involucra a dos participantes respecto a esta solicitud.

media Hugging Face Forums · hace 2 h

UCTF: Un formato universal de entrenamiento comprimido para IA multilingüe

Un nuevo concepto llamado UCTF (Universal Compressed Training Format) propone una capa mediadora para abordar la redundancia semántica en el entrenamiento de LLMs multilingües, comprimiendo diversos idiomas en un formato de token unificado e independiente del idioma.

media Hugging Face Forums · hace 2 h

Creación de un widget de chat web con Gradio Parte IV

Un usuario informa que su widget de chatbot de IA, anteriormente funcional en su sitio web, ha dejado de funcionar debido a un error de política CORS tras una actualización reciente de Gradio. El error indica que el encabezado 'Access-Control-Allow-Credentials' en la respuesta está vacío, lo cual entra en conflicto con el modo de credenciales de la solicitud del cliente.

media Hugging Face Forums · hace 2 h

El lenguaje como portador de inteligencia: Más allá de la predicción de tokens

Este artículo sostiene que los grandes modelos de lenguaje derivan su aparente inteligencia de las profundas relaciones geométricas y estados ocultos dentro del propio lenguaje, en lugar de provenir de un cálculo mecánico independiente o de una simple predicción de tokens.

arxiv arXiv cs.LG · hace 2 h

El marco VibrantForests mapea la estructura del bosque a una resolución de 10 metros

El marco VibrantForests utiliza datos de satélite entrenados con muestras de lidar para generar mapas anuales, continuos y de cobertura total del dosel, altura, biomasa, área basal y diámetro medio cuadrático a una resolución de 10 metros en los Estados Unidos contiguos. Mejora la precisión al reducir la sobreestimación en bosques dispersos y la subestimación en bosques densos, extendiendo el rango de predicciones confiables más allá de los modelos tradicionales de sensores pasivos.

arxiv arXiv cs.LG · hace 2 h

SLiR: Relajaciones lineales basadas en desplazamiento para funciones de activación

SLiR permite relajaciones lineales sólidas y ajustadas de funciones de activación generales utilizando únicamente constantes de Lipschitz o puntos críticos. Logra hasta 7.8x más propiedades de verificación que los métodos de última generación al calcular eficientemente cotas superiores e inferiores mediante un procedimiento de desplazamiento.

arxiv arXiv cs.LG · hace 2 h

Propiedades estadísticas del entrenamiento y la generalización

El artículo examina la desviación del aprendizaje profundo de las intuiciones estadísticas clásicas, enfatizando las leyes de escalado de las redes neuronales y su interacción con las restricciones físicas y los sesgos inductivos en las aplicaciones del aprendizaje automático.

arxiv arXiv cs.LG · hace 2 h

Enfoque basado en modelos para familias de entornos de aprendizaje por refuerzo

Un enfoque basado en modelos genera familias de entornos de aprendizaje por refuerzo utilizando un algoritmo genético híbrido. Las variantes del entorno se crean mediante transformaciones de modelos guiadas por un motor de transformación de modelos de última generación, lo que permite un desarrollo escalable y resistente a errores. El método se valida en escenarios de mitigación de incendios forestales y aprendizaje por currículo.

arxiv arXiv cs.LG · hace 2 h

Las redes neuronales recurrentes aproximan funciones continuas

Una única red neuronal recurrente ReLU con pesos fijos y dimensión oculta puede aproximar uniformemente cualquier función continua en [-1,1] a medida que aumenta su tiempo de ejecución. Esto se logra mediante un nuevo modelo, la máquina de Turing con unidades neuronales (TMNU), que equilibra la flexibilidad algorítmica con una simulación acotada por RNNs. Las tasas de convergencia coinciden con las tasas de aproximación polinomial, y los límites inferiores minimax confirman que el tiempo de ejecución es un recurso esencial e ineludible.

arxiv arXiv cs.LG · hace 2 h

QCPIKAN: Kolmogorov-Arnold Network de Física Informada Cuántico-Clásica para EDPs

QCPIKAN es la primera red de Kolmogorov-Arnold de física informada cuántico-clásica diseñada para resolver ecuaciones diferenciales parciales. Utiliza capas KAN basadas en polinomios de Chebyshev y circuitos cuánticos parametrizados para incrustar restricciones físicas durante el entrenamiento, logrando convergencia exponencial del error y reducción de la dispersión numérica. Validado en escenarios de filtración en medios porosos, supera a las redes neuronales cuántico-clásicas existentes en precisión de predicción, control de errores y seguimiento dinámico.

arxiv arXiv cs.LG · hace 2 h

El modelado híbrido predice la dinámica microbiana en sistemas de suelo

Un nuevo marco de modelado híbrido utiliza datos genómicos y redes neuronales para predecir parámetros biocinéticos en modelos de rotación de materia orgánica del suelo. Incorpora restricciones ecológicas para garantizar una dinámica microbiana realista, incluso para variables no observadas, y supera a los métodos existentes tanto en conjuntos de datos sintéticos como reales con mínimos datos de entrenamiento.

arxiv arXiv cs.LG · hace 2 h

Anillo cuántico de reducción total: ventajas de comunicación y privacidad para el aprendizaje distribuido

Una versión cuántica del anillo de reducción total reduce la comunicación por enlace por un factor de dos utilizando entrelazamiento y codificación superdensa, sin alterar los cálculos del modelo o de los gradientes. Logra una agregación segura desde el punto de vista teórico de la información mediante entrelazamiento verificado, con una sobrecarga de 2x en copias GHZ, y proporciona ventajas de comunicación exponenciales en la detección de conflictos de gradientes para tareas específicas de auditoría.

arxiv arXiv cs.LG · hace 2 h

Q-learning robusto para control de campo medio bajo incertidumbre de Wasserstein

El artículo presenta un algoritmo de Q-learning robusto para problemas de control de campo medio en tiempo discreto con incertidumbre de Wasserstein en ruido común. Combina cuantificación y proyección con una reformulación dual de Wasserstein y establece convergencia con cotas de tiempo finito tanto para esquemas síncronos como asíncronos. Los experimentos numéricos en modelos de riesgo sistémico y epidemias demuestran la compensación entre robustez y rendimiento, así como la convergencia de la implementación asíncrona.

arxiv arXiv cs.LG · hace 3 h

Reducción de la varianza en el aprendizaje por diferencia temporal

El aprendizaje por diferencia temporal reduce la varianza agregando sobre múltiples trayectorias. El estudio muestra que la varianza de TD está acotada asintóticamente por encima de los estimadores de Monte Carlo, y las actualizaciones de horizonte más corto reducen la varianza para muestras fijas. La Estimación Directa de la Ventaja actúa como una variable de control ajustada por regresión, logrando límites de varianza más estrictos que TD en grandes muestras.

arxiv arXiv cs.LG · hace 3 h

¿Entrenar, recuperar o ambos? Comparación directa sobre la citación estatutaria para la RTA de Ontario

Una comparación de cuatro brazos muestra que la recuperación es esencial para una citación estatutaria precisa bajo la Ley de Arrendamientos Residenciales de Ontario. El modelo híbrido SFT+RAG logra un exact-match de 0.481 con cero alucinaciones, superando a los modelos base y solo SFT, e iguala a una pipeline que utiliza modelos más grandes y especializados sin necesidad de más datos o conjuntos de entrenamiento más grandes. Los resultados se basan en un conjunto de evaluación del mundo real pequeño y verificado por humanos y son preliminares.

arxiv arXiv cs.LG · hace 3 h

Protocolo VLM-as-3D-Judge de-biased para Generación de Muebles

Un protocolo de juez basado en VLM de-biased especializa TRELLIS en la generación de muebles mediante adaptación ligera. El protocolo aborda modos de fallo como sobrecarga de imagen y ocultamiento de geometría, con calibración que muestra tasas de victoria de 0.83–1.0 y simetría base-vs-base en 0.5. Entre seis métodos de adaptación, la reparación del condicionador bajo degradación severa alcanza paridad con el modelo base, mientras que ningún método supera el objetivo de tasa de victoria del 65%.

arxiv arXiv cs.LG · hace 3 h

CRAX: Benchmarking rápido y seguro de aprendizaje por refuerzo

CRAX introduce un benchmark de seguridad de alta fidelidad y rápido para el aprendizaje por refuerzo utilizando MuJoCo XLA. Logra aceleraciones de hasta 100x sobre benchmarks basados en CPU mediante vectorización y aceleración de hardware, presentando seis conjuntos de entornos y tres tareas específicas del agente en tres niveles de dificultad. La evaluación de seis métodos de RL seguro muestra que ningún enfoque domina, destacando los compromisos entre rendimiento y seguridad, con el aprendizaje por currículo y la transferencia de seguridad mejorando los resultados.