Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 123

Identificadores naturales para privacidad y auditorías de datos en modelos de lenguaje grandes

Este trabajo introduce identificadores naturales (NIDs), que son cadenas aleatorias estructuradas como hashes criptográficos y URLs acortadas encontradas en los datos de entrenamiento de LLM, para abordar los desafíos de auditar la privacidad de los modelos de lenguaje grandes. Los NIDs permiten auditorías escalables de privacidad diferencial post-hoc sin costoso reentrenamiento y facilitan la inferencia de conjuntos de datos sin requerir conjuntos de datos privados retenidos.

arxiv arXiv cs.LG · hace 7 h

Aumento de datos: Una perspectiva desde el análisis de Fourier

Este artículo investiga si el aumento parcial de datos puede lograr los mismos beneficios estadísticos que el aumento completo, desarrollando un marco basado en el análisis de Fourier y la teoría de representaciones de grupos finitos.

arxiv arXiv cs.LG · hace 7 h

MedPCFM: Mejora de la finalización de nubes de puntos médicos mediante la integración de Transformers de puntos y coincidencia de flujos

Este artículo presenta PCFM, un enfoque de coincidencia de flujos para la finalización de nubes de puntos médicas que integra Point Transformer v3 (PTv3) con modelado generativo de tiempo continuo. El método se evalúa en los conjuntos de datos SkullFix, SkullBreak y Mandibular Defect para evaluar su rendimiento en tareas de reconstrucción anatómica.

arxiv arXiv cs.LG · hace 7 h

Modelo de Aprendizaje Automático Agnóstico de la Habitabilidad Fotosintética

Los investigadores han desarrollado un modelo agnóstico para la Zona Habitable Fotosintética (PHZ) basado en termodinámica y química redox, eliminando los sesgos antropocéntricos encontrados en estimaciones anteriores. Al optimizar una reacción fotoquímica genérica contra espectros de irradiación de exoplanetas utilizando un algoritmo genético, el estudio predice que la viabilidad fotosintética disminuye linealmente con la distancia orbital en lugar de cuadráticamente.

arxiv arXiv cs.LG · hace 7 h

Transformador de dos etapas basado en LLM para el diagnóstico de fallos en rodamientos

Este artículo propone un marco de aprendizaje por transferencia de dos etapas guiado por conocimiento para abordar los desafíos del diagnóstico de fallos en rodamientos que involucran heterogeneidad de conjuntos de datos, variaciones en las condiciones de operación y datos etiquetados limitados. El enfoque utiliza un Transformador ligero estilo GPT-2 con autoatención causal para la extracción jerárquica de características a partir de señales de vibración.

arxiv arXiv cs.LG · hace 7 h

CrossPool: Servicio eficiente de múltiples LLM para modelos MoE en frío mediante la disgregación de KV-Cache y pesos

CrossPool es un motor de servicio diseñado para modelos Mixture-of-Experts (MoE) en frío que aborda las ineficiencias de memoria GPU separando los pesos FFN y el KV-cache en pools distintos. Esta disgregación permite al sistema consolidar los pesos estáticos mientras aprovisiona dinámicamente la demanda activa de KV-cache, superando las limitaciones de la asignación monolítica de memoria.

arxiv arXiv cs.LG · hace 7 h

Una evaluación justa de los Modelos Fundacionales de Grafos para la Predicción de Propiedades de Nodos

Este estudio realiza una reevaluación rigurosa de nueve Modelos Fundacionales de Grafos (GFMs) recientes para la predicción de propiedades de nodos con el fin de abordar la falta de estándares de evaluación unificados en el campo. Los autores comparan estos modelos contra puntos de referencia sólidos de Redes Neuronales de Grafos (GNN) para determinar su rendimiento relativo y eficiencia.

arxiv arXiv cs.LG · hace 7 h

El razonamiento como dinámica de atractores: Recuperación de memoria latente mediante minimización de energía ponderada por Gibbs

Este artículo reinterpreta los Modelos de Lenguaje Grandes como Memorias Asociativas Densas de alta dimensión donde el razonamiento correcto corresponde a cuencas de atracción profundas en el paisaje de energía. Los autores introducen un mecanismo de recuperación que muestrea múltiples trayectorias de razonamiento y las pondera por energía inversa para aproximar la distribución de equilibrio.

arxiv arXiv cs.LG · hace 7 h

EERLoss: Una nueva función de pérdida para entrenar modelos biométricos profundos

Este artículo presenta EERLoss, una aproximación subdiferenciable de la Tasa de Error Igual (EER) diseñada para alinear el entrenamiento de modelos biométricos profundos con las métricas de evaluación principales. Validado en la verificación de dinámica de tecleo utilizando el benchmark KVC-onGoing, el enfoque aborda la desalineación entre los objetivos de optimización y la evaluación del rendimiento.

arxiv arXiv cs.LG · hace 7 h

QC-SMOTE: SMOTE con control de calidad para clasificación desbalanceada

Los autores proponen QC-SMOTE, un marco de sobremuestreo con control de calidad diseñado para abordar la generación de muestras sintéticas de baja calidad en regiones ruidosas o superpuestas comunes en tareas de clasificación desbalanceada. Este método estima la fiabilidad de las muestras minoritarias utilizando una puntuación compuesta de confianza del vecindario y emplea una estrategia best-of-K guiada por IPQ para generar candidatos sintéticos.

arxiv arXiv cs.LG · hace 8 h

ASALT: Alineación adaptativa del estado para transferencia lateral en aprendizaje por refuerzo multiagente

Este artículo presenta ASALT, un método que permite el aprendizaje de transferencia lateral en aprendizaje por refuerzo multiagente al acomodar las discrepancias en la dimensionalidad del espacio de estados entre los dominios de origen y destino. El enfoque utiliza adaptadores a nivel de observación y a nivel de estado para mapear las entradas en un espacio de incrustación compartido, facilitando una transferencia efectiva del conocimiento entre entornos heterogéneos.

arxiv arXiv cs.AI · hace 8 h

Aterrizaje Ontológico de Nivel Cruzado de Permisos, Prohibiciones y Deberes en ODRL

El artículo formula el Principio de Diseño de Nivel Cruzado para abordar cómo los evaluadores de políticas ODRL no logran especificar posiciones normativas, estructuras de autoridad o poder de declaración de violación. Establece que cualquier lenguaje normativo con normas violables requiere tanto posiciones a nivel de conducta como Permiso y Deber, como posiciones a nivel de competencia tales como Poder e Inmunidad.

arxiv arXiv cs.AI · hace 8 h

MVG-KAN: KAN guiado por Geo-Viento de múltiples vistas para la predicción de PM2.5

Los investigadores proponen MVG-KAN, un modelo para la predicción precisa a corto plazo de PM2.5 que aborda las limitaciones de los métodos existentes en la captura de la dispersión compleja de contaminantes impulsada por factores meteorológicos.

arxiv arXiv cs.AI · hace 8 h

Acelerando el RL desagregado para LLMs visuales generativos con paralelismo basado en difusión

Los investigadores presentan DigenRL, un marco de aprendizaje por refuerzo desagregado diseñado para abordar las ineficiencias de la ejecución colocalizada en modelos de lenguaje grande generativos basados en difusión. El sistema admite asignación flexible de recursos y GPUs heterogéneas mientras utiliza técnicas de paralelismo novedosas para reducir las burbujas de ejecución.

arxiv arXiv cs.AI · hace 8 h

Cuando la utilidad supera la precaución causal: Supresión y recuperación dependientes del contexto en los LLM

Un estudio revela que los modelos de lenguaje grandes suprimen sistemáticamente la 'Precaución Causal'—la tendencia a abstenerse de emitir juicios causales sin evidencia suficiente—al pasar de contextos académicos a contextos de asesoramiento práctico. Esta supresión ocurre a pesar de que los modelos conservan la capacidad subyacente, como lo demuestra la habilidad de restaurar el razonamiento cauteloso mediante prompts específicos.

arxiv arXiv cs.AI · hace 8 h

Convoluciones de Kolmogorov-Arnold Estructurales: Función aprendible en los valores o la forma del filtro

El artículo introduce Redes de Kolmogorov-Arnold Estructurales (KANs) que colocan funciones aprendibles en la estructura de convolución en lugar de en las entradas individuales del kernel, organizando el diseño según si la función actúa sobre los valores de píxel o la forma del filtro. Presenta tres realizaciones: SV-KAN con una función de valor compartida, AG-KAN usando un adaptador gaussiano adaptativo al contenido, y RF-KAN que construye filtros a partir de perfiles de cresta orientados en una base de wavelet Morlet.

arxiv arXiv cs.AI · hace 8 h

Sobre la estabilidad del ranking de prompts en la evaluación de modelos de lenguaje grandes

Este artículo estudia sistemáticamente la estabilidad de los rankings de prompts bajo fuentes comunes de variabilidad, como semillas aleatorias y subconjuntos limitados de evaluación, en tres LLMs de peso abierto y dos tareas de benchmark.

arxiv arXiv cs.AI · hace 8 h

Explicación neural consistente en ciclo de certificados de verificación formal

Los investigadores proponen una arquitectura neural consistente en ciclo que genera explicaciones en lenguaje natural fieles para certificados de verificación formal, abordando la opacidad de estas pruebas verificables por máquina para no especialistas. El sistema alcanza una solidez verificada en ciclo del 90.0% en datos de prueba de un dominio de cumplimiento financiero, superando significativamente a las líneas base multi-LLM tanto en precisión como en velocidad de inferencia.

media r/LocalLLaMA · hace 8 h

Ornith 35B funciona razonablemente bien con el modelo especulativo Qwen3.6 35B DFlash

Un usuario reporta haber logrado un aumento del 30-40% en la velocidad de generación de tokens al emparejar el modelo Ornith-1.0-35B como modelo borrador con Qwen3.6-35B-A3B-DFlash usando llama-server.

arxiv arXiv cs.AI · hace 9 h

PHANTOM: Un conjunto de datos a gran escala de ataques adversarios multimodales para modelos de visión y lenguaje

Los investigadores han presentado PHANTOM, un conjunto de datos a gran escala y de código abierto que contiene 47.524 ataques adversarios pregenerados diseñados para evaluar la seguridad y robustez de los modelos de visión y lenguaje (VLMs). Este recurso consolida y amplía benchmarks anteriores al cubrir 10 categorías de alto nivel y 55 subcategorías de intenciones dañinas, con el objetivo de reducir las barreras computacionales para la investigación adversarial.