Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 76

Privacidad diferencial en el muestreo posterior de procesos gaussianos

El muestreo posterior de procesos gaussianos proporciona inherentemente privacidad diferencial debido a su aleatoriedad intrínseca. Los límites explícitos de Rényi-DP muestran que la privacidad depende de la regularización ridge, con ataques de inferencia de pertenencia que confirman los patrones de fuga predichos. Añadir ruido GP calibrado mejora la privacidad mientras mantiene la utilidad en tareas posteriores.

arxiv arXiv cs.LG · hace 1 h En vivo

McWC: Pronóstico con Ciclicidad, Tendencia y Correlación de Canales

McWC introduce un modelo que captura por separado la ciclicidad, la tendencia y las correlaciones inter-canales en el pronóstico de series temporales a largo plazo. Utiliza construcción de ciclicidad multicapa, descomposición wavelet y un perceptrón multicapa para extraer y fusionar información de alta y baja frecuencia, mientras desacopla las autocorrelaciones intra-canal mediante una pérdida en el dominio de la frecuencia. Los experimentos en seis conjuntos de datos del mundo real muestran que McWC logra un rendimiento de vanguardia con alta eficiencia computacional.

arxiv arXiv cs.LG · hace 1 h En vivo

Suficiencia del enlace parcial en modelos de fundación de grafos de conocimiento

Un nuevo estudio muestra que los KGFMs pueden predecir enlaces completos utilizando solo observaciones parciales, como enlaces parciales. Identifica cuatro escenarios basados en enlaces parciales observados y revela que los modelos de última generación aprovechan los enlaces parciales vistos, mientras que los no vistos presentan desafíos significativos de generalización. Esta taxonomía ofrece un marco diagnóstico para evaluar y mejorar la robustez del KGFM.

arxiv arXiv cs.LG · hace 1 h En vivo

C2FL: Aprendizaje Federado Continuo Agrupado bajo Deriva Espacial y Temporal

C2FL es un enfoque de aprendizaje federado distribuido que permite a los nodos autoorganizarse en agrupaciones espaciales basadas en proximidad geográfica. Aborda la deriva temporal combinando repetición de experiencias con promediado adaptativo consciente del tiempo de permanencia, permitiendo a los nodos mantener conocimiento actualizado y específico de la región mientras se adaptan a las condiciones ambientales cambiantes.

arxiv arXiv cs.LG · hace 1 h En vivo

BLITZ: Prueba de independencia condicional no paramétrica rápida y calibrada

BLITZ introduce un método de regresión en dos etapas para la prueba de independencia condicional no paramétrica. Primero elimina dependencias suaves amplias mediante regresión polinómica, luego aplica regresiones con árboles poco profundos para residualizar características no lineales, permitiendo pruebas precisas y rápidas con una mejor calibración nula en comparación con los métodos existentes.

arxiv arXiv cs.AI · hace 1 h En vivo

STAR: Asignación de recompensa adaptativa espaciotemporal para el post-entrenamiento RL de texto a imagen

STAR introduce un método de asignación de recompensa espaciotemporal para la generación de texto a imagen, utilizando mapas de atención para asignar dinámicamente ventajas en los pasos de desruido. Mejora la alineación semántica, la renderización de texto y la optimización de preferencias en Stable Diffusion 3.5 Medium, logrando 0.9759, 0.9757 y 23.60 en GenEval, OCR y PickScore respectivamente.

arxiv arXiv cs.AI · hace 1 h En vivo

Modelado de latentes semántico primero para la reconstrucción de RMN 3D

Un nuevo marco prioriza las semánticas anatómicas durante la compresión latente de RMN 3D, abordando la coherencia a largo plazo y la pérdida de detalles clínicos. Introduce un Codificador de Armonización Latente y un Bloque de Recuperación Semántica para preservar estructuras significativas, y una Pérdida de Frecuencia consciente de la anatomía para mantener las características diagnósticas de alta frecuencia. Los experimentos en conjuntos de datos públicos de RMN muestran una mejor calidad de reconstrucción y síntesis entre contrastes.

arxiv arXiv cs.AI · hace 1 h En vivo

McWC: Pronóstico con Ciclicidad, Tendencia y Correlación de Canales

arxiv arXiv cs.AI · hace 1 h En vivo

Se lanza el conjunto de datos de presentaciones EDGAR de Stanford

Stanford presenta SEFD, una reconstrucción fiel a la disposición de las presentaciones ante la SEC en MultiMarkdown. El conjunto de datos SEFD-v1 con 152B tokens permite el modelado del lenguaje financiero e incluye benchmarks para pronósticos y transcripción de tablas, con menos del 0.1% de superposición con Common Crawl.

arxiv arXiv cs.LG · hace 1 h En vivo

ActiveSAM: Segmentación rápida y precisa de vocabulario abierto

ActiveSAM es un marco sin entrenamiento y zero-shot que mejora SAM 3 para la segmentación semántica de vocabulario abierto identificando un conjunto activo de clases condicionado por imagen. Mejora el equilibrio entre velocidad y precisión, superando a SegEarth-OV3 en +1.4 mIoU en promedio y ejecutándose hasta 5.5 veces más rápido en conjuntos de datos de gran vocabulario, con una fuerte robustez ante la corrupción de imágenes.

arxiv arXiv cs.AI · hace 1 h En vivo

Bucle ReAct compatible con T-API para redes ópticas

Se introduce un bucle agénico ReAct compatible con T-API para redes ópticas, que permite la gestión en circuito cerrado basada en intenciones. Las herramientas compuestas específicas del dominio logran una corrección validada por oráculo del 90% y reducen el uso de tokens en tres veces en comparación con las herramientas genéricas.

arxiv arXiv cs.AI · hace 1 h En vivo

C2FL: Aprendizaje Federado Continuo Agrupado bajo Deriva Espacial y Temporal

C2FL es un enfoque de aprendizaje federado distribuido que permite a los nodos autoorganizarse en clústeres espaciales basados en proximidad geográfica. Aborda la deriva temporal combinando repetición de experiencias con promediado adaptivo consciente del tiempo de permanencia, permitiendo a los nodos mantener conocimiento actualizado y específico de la región mientras se adaptan a las distribuciones de datos en evolución.

arxiv arXiv cs.AI · hace 1 h En vivo

Teoría del Comportamiento del Consumidor con LLM: Un Nuevo Campo de Investigación

Este artículo presenta la Teoría del Comportamiento del Consumidor con LLM, un nuevo campo que analiza cómo los modelos de lenguaje grandes toman decisiones de consumo en nombre de los usuarios. Unifica investigaciones sobre la toma de decisiones con LLM, la simulación del comportamiento humano y la elicición de preferencias bajo principios económicos, identificando brechas clave en supuestos como la racionalidad y la heterogeneidad en mercados basados en agentes.

arxiv arXiv cs.AI · hace 1 h En vivo

LegalHalluLens: Auditoría de alucinaciones en IA legal

LegalHalluLens introduce un marco para auditar alucinaciones de la IA en contextos legales mediante el análisis de perfiles de alucinación tipificados en cuatro categorías de afirmaciones. Revela una brecha de 38-40 puntos entre las afirmaciones obligatorias/numéricas y temporales, y muestra que dos sistemas con tasas de alucinación idénticas del 52% pueden tener direcciones de riesgo opuestas. El marco utiliza un Índice de Dirección de Riesgo y pipelines de debate calibrados para reducir las detecciones fabricadas en un 45% y mejorar la responsabilidad en el despliegue de IA legal.

arxiv arXiv cs.AI · hace 1 h En vivo

El olvido catastrófico es de bajo rango: una teoría en el espacio de funciones

Una teoría en el espacio de funciones revela que el olvido catastrófico en la adaptación continua se concentra en un pequeño número de modos propios NTK de tareas anteriores. En PEFT-CL con cabeza lineal y backbone congelado, el vector de olvido es exactamente predecible hasta la precisión numérica, con una regla de escalado de Kronecker para el rango vulnerable.

arxiv arXiv cs.AI · hace 1 h En vivo

Efectos del idioma de origen en el aprendizaje en contexto multilingüe

Un estudio descubre que los supuestos basados en ajuste fino sobre la transferencia entre idiomas no se aplican en el aprendizaje en contexto con pocos ejemplos. La investigación revela que la selección del idioma de origen impacta significativamente el rendimiento e identifica nuevas heurísticas para un ICL multilingüe efectivo.

arxiv arXiv cs.AI · hace 1 h En vivo

ProvenanceGuard: Verificación de factualidad consciente de la fuente para agentes LLM basados en MCP

ProvenanceGuard introduce un verificador consciente de la fuente para agentes LLM basados en MCP que detecta la confluencia entre fuentes al enrutar afirmaciones a fuentes de evidencia específicas y comparar la atribución declarada con la propiedad real de la fuente. Logra un F1 por bloque de 0.802 y una precisión de fuente de 0.858 en 260 afirmaciones elegibles por fuente, superando a las líneas base ciegas a la fuente, y detecta todos los intercambios de atribución inyectados en 50 pruebas clínicas.

arxiv arXiv cs.AI · hace 1 h En vivo

La experiencia vivida sintética de la IA en el apoyo al cuidado

Los LLM pueden generar respuestas similares a las de pares que imitan narrativas personales, creando una falsa impresión de experiencia vivida. El análisis psicolingüístico muestra que la IA utiliza menos lenguaje en primera persona y centrado en el pasado que los humanos, y a menudo fabrica fundamentos experienciales. Esto revela una brecha en la autenticidad narrativa, requiriendo que los sistemas de IA distingan entre un marco de apoyo y una experiencia vivida fabricada.

arxiv arXiv cs.AI · hace 1 h En vivo

PseudoBench: Evaluación de la resistencia de los sistemas de auto-investigación agéntica frente a la seudociencia

PseudoBench evalúa la capacidad de los sistemas de auto-investigación agéntica para detectar afirmaciones seudocientíficas. Al probar siete agentes de última generación, encuentra tasas de rechazo cercanas a cero y solo un 27,4% de resistencia a las narrativas seudocientíficas. Los sistemas actuales suelen presentar la seudociencia con lenguaje científico creíble, lo que destaca un riesgo crítico para la integridad científica.

arxiv arXiv cs.AI · hace 1 h En vivo

Indicaciones de seguridad y privacidad en conversaciones usuario-LLM

Un estudio de 14.727 indicaciones de seguridad y privacidad de 3,2M de conversaciones reales entre usuarios y LLMs identifica nueve categorías de preguntas de S&P. El análisis temático y las pruebas de respuesta muestran que los LLMs comerciales superan a los modelos abiertos, con GPT 5.5 proporcionando buenas respuestas en el 98% de las indicaciones frente al 47% de Llama 4, aunque algunos modelos comerciales producen respuestas inconsistentes entre ejecuciones.