Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 124

Generación de video autónoma con controlabilidad contrafáctica para modelos del mundo autoevolutivos

El artículo sostiene que los modelos actuales de generación de video aprenden solo modelos del mundo espaciotemporales parciales e implícitos, en lugar de completamente fundamentados o controlables. Afirma que la realismo predictivo por sí solo es insuficiente para crear agentes físicos porque estos modelos a menudo fallan al identificar variables controlables y restricciones de encarnación.

arxiv arXiv cs.LG · hace 7 h

BehaviorBench: Evaluación de modelos fundamentales para tareas de ciencias del comportamiento

Los autores presentan BehaviorBench, un benchmark integral diseñado para evaluar modelos fundamentales en diversas tareas y poblaciones de ciencias del comportamiento. El estudio evalúa cuatro capacidades principales—predicción de comportamiento, toma de decisiones estratégicas, inferencia de rasgos del sujeto y aplicación de conocimiento conductual—tanto a nivel individual como distribucional.

arxiv arXiv cs.LG · hace 7 h

Una base paninian para el procesamiento de lenguas indias

El artículo sostiene que la infraestructura de procesamiento del lenguaje natural para los más de mil millones de hablantes de lenguas indias está fragmentada debido a la falta de cimientos estructurales compartidos. Propone aprovechar la arquitectura morfosintáctica formalizada en el Astādhyāyī de Pānini como un marco computacional unificador para mejorar la precisión y la eficiencia de los datos.

arxiv arXiv cs.LG · hace 7 h

Modelos de Transformer ligeros para detección de fallos en dispositivo: Un estudio de referencia sobre implementación con recursos limitados

Este estudio compara métodos tradicionales de aprendizaje automático frente a arquitecturas de transformer ligeras para la detección binaria de fallos en tres conjuntos de datos públicos, evaluando los compromisos entre precisión, tamaño del modelo y latencia. La investigación evalúa el rendimiento de clasificación utilizando F1-score y AUC, mientras también prueba la cuantización dinámica INT8 y un pipeline de inferencia adaptativo en dos etapas para optimizar la implementación en hardware con recursos limitados.

arxiv arXiv cs.LG · hace 7 h

Proyecto Ariadne: Generación de rutas condicionada por prompt para la planificación de síntesis

Los investigadores presentan Ariadne, un modelo solo de decodificador que reformula la planificación retrosintética como generación de secuencia condicionada por prompt, permitiendo que las moléculas objetivo, las restricciones y las rutas se representen en una sola secuencia. Este enfoque elimina la necesidad de modelos separados adaptados a especificaciones de planificación específicas.

arxiv arXiv cs.LG · hace 7 h

Evaluación automatizada de gráficos de residuos con el paquete R autovi y la aplicación Shiny autovi.web

El artículo presenta un paquete R y una aplicación Shiny diseñados para automatizar la evaluación visual de los gráficos de residuos de modelos lineales, abordando los problemas de escalabilidad y consistencia inherentes a la evaluación manual.

media r/LocalLLaMA · hace 7 h

gracias a /u/TheDankestSlav por esta joya

Este post de Reddit en r/LocalLLaMA es un simple agradecimiento al usuario /u/TheDankestSlav. Enlaza a una imagen compartida por el usuario, descrita como una "joya".

media r/LocalLLaMA · hace 7 h

Usuario de Reddit critica las afirmaciones de Dario Amodei sobre IA de código abierto

Un usuario de Reddit argumenta que el CEO de Anthropic, Dario Amodei, comprende fundamentalmente mal cómo funcionan los modelos de IA de código abierto, refutando específicamente su reciente testimonio ante el Congreso del 28 de junio de 2026. El autor sostiene que las afirmaciones de Amodei sobre transparencia y accesibilidad son incorrectas desde el punto de vista factual basándose en el estado actual de los modelos de pesos abiertos.

lab Claude Code Releases · hace 7 h

Notas de la versión 2.1.196 de Claude Code

Claude Code versión 2.1.196 introduce modelos predeterminados de organización, archivos adjuntos clicables y una seguridad mejorada para las aprobaciones del servidor MCP. La actualización también mejora la fiabilidad de las sesiones en segundo plano, corrige varios problemas de informe de estado del agente y optimiza el uso de tokens en flujos de trabajo de revisión de código.

arxiv arXiv cs.LG · hace 8 h

MotifGen: Interpolación espacio-temporal de imágenes satelitales desalineadas mediante modelado generativo multi-fuente

Los investigadores presentan MotifGen, un modelo generativo diseñado para la interpolación espacio-temporal de imágenes de microondas de ciclones tropicales a partir de múltiples fuentes geoespaciales con intervalos de tiempo irregulares y desalineación geográfica. El modelo aborda el desafío de la alta heterogeneidad en los datos de microondas combinando entradas de varios instrumentos para llenar los vacíos causados por los largos tiempos de revisita satelital.

arxiv arXiv cs.LG · hace 8 h

Esquemas numéricos profundos para sistemas de eBSDEs ergódicos con aplicaciones a utilidades hacia adelante con cambio de régimen

Este artículo presenta dos esquemas numéricos basados en redes neuronales para resolver sistemas de ecuaciones diferenciales estocásticas backward acopladas ergódicas (eBSDEs), motivado por la aproximación de estrategias óptimas en modelos de factores estocásticos con cambio de régimen.

arxiv arXiv cs.LG · hace 8 h

PROTECT-90: Un conjunto de datos de fallos para la protección de sistemas eléctricos

Este artículo presenta el conjunto de datos PROTECT-90, una referencia de benchmark simulada por transitorios electromagnéticos (EMT) y de acceso abierto diseñada para abordar la falta de conjuntos de datos de formas de onda de alta tensión estandarizados y disponibles públicamente para la protección de sistemas eléctricos. El lanzamiento tiene como objetivo permitir una evaluación transparente y reproducible de métodos basados en datos mediante mediciones consistentes similares a las de registradores digitales de fallos.

arxiv arXiv cs.LG · hace 8 h

Gestión de la ejecución de tareas para cargas de trabajo desconocidas en IoT sin batería: Una evaluación agnóstica al hardware

Este estudio propone dos estrategias dinámicas de programación agnósticas al hardware, un agente de Aprendizaje por Refuerzo libre de modelos y un método de Predición Aproximada sobre la marcha, para gestionar la energía volátil en sistemas IoT sin batería sin perfiles previos de tareas. Evaluadas frente a líneas base adaptativas y estáticas utilizando un marco de simulación personalizado, la investigación destaca compensaciones operativas distintas para diferentes restricciones del sistema.

arxiv arXiv cs.LG · hace 8 h

Segmentación BEV de vocabulario abierto con restricciones geométricas conscientes del 3D

Los autores presentan OVBEVSeg, un marco para la segmentación en vista de pájaro (BEV) de vocabulario abierto que utiliza modelos de visión-lenguaje para reconocer categorías más allá del conjunto de entrenamiento mientras mantiene una eficiencia en tiempo real. Para abordar la inconsistencia geométrica 3D inherente al elevar semánticas 2D a BEV, el método emplea restricciones geométricas 3D robustas a través de tres etapas progresivas.

arxiv arXiv cs.LG · hace 8 h

PHANTOM: Un conjunto de datos a gran escala de ataques adversarios multimodales para modelos de visión y lenguaje

Los autores presentan PHANTOM, un conjunto de datos abierto y a gran escala que contiene 47.524 ataques adversarios pregenerados diseñados para evaluar la seguridad y robustez de los modelos de visión y lenguaje (VLMs). Este recurso consolida las evaluaciones existentes y las extiende con nuevas categorías para proporcionar datos de evaluación diversos y prácticos para la comunidad investigadora.

arxiv arXiv cs.LG · hace 8 h

Dirección de Variedad Paralela: Adaptación Eficiente de Grandes Memorias Asociativas Mediante Moldeado de Energía Residual

Los autores proponen H-Res (Dirección Residual Jerárquica), un mecanismo que adapta grandes modelos Transformer modulando su paisaje de energía efectivo sin alterar el equilibrio global ni expandir la longitud de la secuencia. Este enfoque formula la adaptación como un problema de control en la variedad de activaciones para dirigir las trayectorias de tokens hacia cuencas de atracción específicas de la tarea.

arxiv arXiv cs.LG · hace 8 h

RE4: Imitación consciente de la transformación de interacciones de objetos utilizando modos de manipulación

Este artículo presenta RE4, un marco para el aprendizaje por imitación que combina teorías fundamentadas de manipulación con benchmarks modernos para preservar tanto el rendimiento como la interpretabilidad en tareas de interacción con objetos. El enfoque utiliza estimación de pose ligera y auto-supervisada, junto con transformaciones conscientes del modo, para recuperar y replanificar demostraciones de manera efectiva.

media r/LocalLLaMA · hace 8 h

Presentamos LongCat-2.0, un modelo de lenguaje MoE a gran escala

LongCat-2.0 se presenta como un modelo de lenguaje MoE (Mixture of Experts) a gran escala con 1,6 billones de parámetros en total y aproximadamente 48 mil millones activados por token.

arxiv arXiv cs.LG · hace 9 h

Identificadores naturales para privacidad y auditorías de datos en modelos de lenguaje grandes

Este trabajo introduce identificadores naturales (NIDs), que son cadenas aleatorias estructuradas como hashes criptográficos y URLs acortadas encontradas en los datos de entrenamiento de LLM, para abordar los desafíos de auditar la privacidad de los modelos de lenguaje grandes. Los NIDs permiten auditorías escalables de privacidad diferencial post-hoc sin costoso reentrenamiento y facilitan la inferencia de conjuntos de datos sin requerir conjuntos de datos privados retenidos.

arxiv arXiv cs.LG · hace 9 h

Aumento de datos: Una perspectiva desde el análisis de Fourier

Este artículo investiga si el aumento parcial de datos puede lograr los mismos beneficios estadísticos que el aumento completo, desarrollando un marco basado en el análisis de Fourier y la teoría de representaciones de grupos finitos.