Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 1 / 79

arxiv arXiv cs.AI · hace 2 h

Aprendiendo políticas óptimas de Pareto justas en aprendizaje por refuerzo multiobjetivo

El artículo presenta un marco para el aprendizaje por refuerzo multiobjetivo con múltiples políticas que aprende un conjunto de políticas óptimas de Pareto garantizando equidad entre diversas preferencias de usuarios. Demuestra que las políticas justas permanecen dentro del conjunto de cobertura convexa para funciones de bienestar cóncavas como GGF y propone tres algoritmos que incorporan políticas no estacionarias y estocásticas para adaptarse a inequidades históricas. Los resultados empíricos muestran que estos métodos aprenden efectivamente políticas justas en múltiples dominios.

arxiv arXiv cs.AI · hace 2 h

Ternary Mamba: QAT preentrenada para compresión eficiente de SSM

Ternary Mamba logra una compresión de 3.61x de Mamba-2 mediante entrenamiento cuantizado con conciencia de cuantización agrupado desde un checkpoint preentrenado, reduciendo la memoria de 2,687 a 744 MB. Alcanza una precisión zero-shot del 48.1% con solo 102M tokens y 4 GPU-hours, igualando a Bi-Mamba dentro de 0.9 puntos porcentuales, mientras revela nueva inestabilidad de las escalas de cuantización aprendibles y acumulación de errores en la recurrencia.

arxiv arXiv cs.AI · hace 2 h

Primera Prueba Segunda Lote: IA Evaluada en Problemas de Matemáticas de Nivel de Investigación

Un estudio evaluó varios sistemas de IA en diez problemas de matemáticas de nivel de investigación creados por matemáticos prominentes. Los resultados incluyen soluciones generadas por IA, soluciones humanas e informes de árbitros, ofreciendo una evaluación detallada del rendimiento de la IA en la resolución de problemas matemáticos avanzados.

arxiv arXiv cs.AI · hace 2 h

Las inyecciones de triple llave en Handlebars explotan los delimitadores de rol estructural

La interpolación de triple llave de Handlebars no protege contra la inyección de rol estructural, ya que el escape HTML solo neutraliza los delimitadores de corchetes angulares. Deja intactos los delimitadores de dos puntos y hash de Markdown, permitiendo a los atacantes secuestrar los turnos del modelo. El escape predeterminado no proporciona protección para la mayoría de las familias de delimitadores y no puede reemplazar una separación estructural entre instrucción y datos.

arxiv arXiv cs.AI · hace 2 h

Flujo de trabajo de ML embebido para dispositivos de borde con microcontroladores

Este artículo describe un flujo de trabajo orientado a sistemas para el aprendizaje automático embebido en dispositivos de clase microcontroladora. Detalla decisiones clave de ingeniería como la muestreo de datos, extracción de características, validación del desbalance de clases, co-diseño modelo-tiempo de ejecución y despliegue en streaming, utilizando el reconocimiento de movimiento inercial y la detección de palabras clave como estudios de caso. El trabajo proporciona reglas prácticas de diseño para una inferencia robusta en dispositivo, incluyendo curación de datos, cuantización, umbralización, programación y monitoreo en campo.

arxiv arXiv cs.AI · hace 2 h

Presentación de COGNITIVE ATROPHY BENCH para interacciones de salud mental con LLM

Un nuevo benchmark, COGNITIVE ATROPHY BENCH, mide cómo los LLM inducen deterioro cognitivo en conversaciones de salud mental. Construido a partir de 1,576 sesiones de consejería generadas por humanos y evaluado por expertos clínicos, identifica patrones como consejos directivos y validación que pueden reducir la autonomía del usuario. La herramienta introduce métricas como UIRI y ARI para evaluar el riesgo de atrofia y rastrear trayectorias conductuales a lo largo de las interacciones con el usuario.

arxiv arXiv cs.AI · hace 2 h

Reutilización del Conocimiento Meta en el Aprendizaje por Refuerzo

Un nuevo marco aprende conocimiento a nivel de tarea en un agente simplificado y lo transfiere a agentes heterogéneos. Utiliza priors no paramétricos bayesianos y una política de alto nivel para generar guía de tareas, con una interfaz de magnitud semántica y un adaptador temporal para alinear el conocimiento meta con controladores específicos de la encarnación. Los experimentos muestran una reducción del 94.75% al 99.79% en el error de seguimiento del paso final y un rendimiento comparable utilizando el 23.8% de los datos de interacción de los métodos más avanzados.

arxiv arXiv cs.AI · hace 2 h

Presentación de C3GD: Un conjunto de datos público de audio de disparos

El conjunto de datos de clasificación de calibre de disparo Certus (C3GD) contiene más de 8000 muestras de audio de disparos recopiladas en campo, procedentes de 28 armas de fuego y 16 calibres. Ofrece metadatos detallados sobre armas de fuego, calibres, micrófonos y colocación, lo que permite un análisis académico sólido y aplicaciones del mundo real en la detección de disparos y el procesamiento de señales de audio.

arxiv arXiv cs.AI · hace 2 h

TAC: Primer benchmark agéntico para el bienestar animal en IA

TAC evalúa si los agentes de IA evitan la explotación animal en las reservas de viajes. Los siete modelos de vanguardia obtienen puntuaciones por debajo del 64% como nivel aleatorio, con Claude Opus 4.7 al 53%. Añadir un prompt del sistema consciente del bienestar mejora significativamente el rendimiento, aunque los modelos no muestran evidencia de conciencia de la evaluación en sus respuestas.

arxiv arXiv cs.AI · hace 2 h

La resistencia de la memoria flash como capital depreciado en la memoria del robot

La resistencia de la memoria flash de un robot es un activo no renovable que se degrada con cada escritura. Un modelo de precios consciente del desgaste introduce un precio sombra $η$ para guiar la colocación de la memoria entre RAM, NVM y la nube, con el enrutamiento óptimo dependiendo de la asociación valor-escritura $χ$. Las mediciones empíricas muestran que $χ$ es positivo en manipulación a largo plazo, nulo en tareas a corto plazo y negativo en teleoperación, y el presupuesto de resistencia es limitante solo en memoria QLC/eMMC de gama baja, donde el control consciente del desgaste influye en el enrutamiento basado en el valor de la tarea sin mejorar el rendimiento.

arxiv arXiv cs.AI · hace 2 h

WEQA: Respuesta a preguntas de salud con dispositivos portátiles mediante razonamiento agente adaptativo a la consulta

WEQA presenta un marco de agentes adaptativos a la consulta que combina modelos de lenguaje con herramientas especializadas de análisis de datos de dispositivos portátiles. Supera a las líneas base de LLM y agentes en un 24% en precisión y demuestra una utilidad mejorada y solidez clínica en evaluaciones de expertos y usuarios.

arxiv arXiv cs.AI · hace 2 h

LEADS: Descubrimiento agéntico de modelos híbridos para la electrofisiología cardíaca

LEADS propone un marco que utiliza un agente LLM para descubrir modelos híbridos de electrofisiología cardíaca a través de un bucle iterativo de razonamiento y acción. Formula el conocimiento del dominio como un espacio de acciones estructurado, permitiendo diseños de modelos físicamente fundamentados, interpretables y numéricamente estables, superando tanto a los diseñados por humanos como a otros enfoques basados en LLM en datos cardíacos sintéticos y reales.

arxiv arXiv cs.AI · hace 2 h

ReAge3D: Re-envejecimiento facial 3D realista con consistencia de vista

ReAge3D introduce un marco para el re-envejecimiento facial 3D realista y que preserva la identidad. Utiliza un modelo de difusión 2D y edición centrada hacia afuera para garantizar la consistencia multi-vista, preservando los detalles finos relacionados con la edad mediante difusión enmascarada y reconstrucción de vista.

arxiv arXiv cs.AI · hace 2 h

Brecha de medición en la automatización del derecho de la UE

Los modelos de lenguaje grandes pueden producir texto jurídico de calidad mediana, pero ningún benchmark evalúa su capacidad para realizar razonamiento jurídico doctrinal. Esta brecha socava el requisito del Reglamento de IA de la UE sobre 'precisión adecuada' en la IA judicial, ya que la evaluación necesaria del razonamiento doctrinal sigue ausente.

arxiv arXiv cs.AI · hace 2 h

Señales de oráculo en código de prueba generado por agentes

Un estudio empírico de 86.156 parches de archivos de prueba procedentes de 33.596 PRs generados por agentes revela que el 80,2% de los parches de prueba contienen señales de oráculo débiles o inexistentes. Los archivos de prueba con oráculo fuerte mejoran significativamente la probabilidad de fusión (OR = 1,28, p < 0,001) después de ajustar por múltiples factores, lo que indica que la presencia del archivo de prueba por sí sola sobrestima la fuerza de verificación.

arxiv arXiv cs.AI · hace 2 h

IUU+DB: Base de datos impulsada por LLM para pesca ilegal y crímenes en la cadena de suministro

IUU+DB es un sistema impulsado por modelos de lenguaje grande que rastrea la pesca ilegal, no declarada y no reglamentada, el fraude de mariscos y los abusos laborales. Extrae elementos clave de datos de documentos diversos, clasifica incidentes relevantes y permite análisis de tendencias para identificar puntos calientes geográficos y conductuales. El sistema apoya la investigación, evaluaciones de riesgo y aplicación de políticas en pesquerías y cadenas de suministro.

arxiv arXiv cs.AI · hace 2 h

Regresión de Kolmogorov para Políticas de Difusión Robustas

Una ecuación de Kolmogorov hacia atrás eleva las políticas de difusión a un espacio de Cameron-Martin, reemplazando el emparejamiento estocástico de puntas con una EDP determinista. Este enfoque logra cotas de convergencia vinculadas al rango efectivo del núcleo, regularidad mejorada de la trayectoria y un detector de fallos sin recompensas, mostrando una recompensa 17% mayor y una deriva reducida en un 67.6% en PushT, y un RMSE 28.4% menor con detección perfecta del cuello de botella en una línea de fabricación. La teoría de Hamilton-Jacobi reduce los eventos de punto muerto en un 96% en simulaciones.

arxiv arXiv cs.AI · hace 2 h

DRFLOW: Benchmark para la Predicción de Flujos de Trabajo Personalizados

DRFLOW introduce un benchmark para evaluar la capacidad de los agentes de predecir flujos de trabajo personalizados a partir de fuentes heterogéneas. Incluye 100 tareas en cinco dominios, fundamentadas en 3,900 fuentes y con 1,246 pasos de flujo de trabajo de referencia. DRFLOW-Agent logra hasta un 10.02% de mejora en F1 sobre las líneas base, pero aún persisten desafíos significativos en la predicción precisa de flujos de trabajo.

arxiv arXiv cs.AI · hace 2 h

Un estudio de red-team descubre que los LLMs de vanguardia siguen siendo vulnerables a ataques adaptativos

Un estudio de red-team de los modelos Fable 5 y Opus 4.8 de Anthropic revela que ambos son vulnerables a ataques iterativos adaptativos, con Opus 4.8 comprometido en el 11.5% de las intenciones dañinas y Fable -5 en el 6.1%. A pesar de las defensas robustas, ambos modelos generaron 1,620 y 702 completaciones dañinas confirmadas por panel a través de todas las categorías de daño, de manera automática y eficiente bajo ataque automatizado.

arxiv arXiv cs.AI · hace 2 h

RubricsTree: Marco de evaluación escalable para agentes de salud personal

RubricsTree introduce una taxonomía jerárquica de más de 100 rúbricas booleanas clínicamente verificables, evolucionadas a partir de 4.000 consultas reales de usuarios mediante curación con intervención humana. Permite la evaluación escalable y alineada con expertos de agentes de salud personal, enrutando dinámicamente las consultas a las rúbricas relevantes y superando a los métodos base en alineación, detección de degradación del contexto y mejoras en el rendimiento del modelo de hasta el 66% en HealthBench.