Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 110

Problema abierto: ¿Es efectivo AdamW bajo ruido de cola pesada?

Este artículo aborda la falta de una teoría rigurosa de convergencia para el optimizador AdamW en regímenes con ruido estocástico de gradiente pesado de cola, común en el preentrenamiento de grandes modelos de lenguaje. Cuestiona si AdamW puede converger bajo estas condiciones o si su acumulador de segundo momento crea una obstrucción genuina.

arxiv arXiv cs.LG · hace 5 h

Navegación semántica: diversidad controlable para la generación de imágenes

Este artículo presenta Semantic Browsing, un método para generar diversidad controlada en modelos de texto a imagen al imponer estructura a las muestras generadas con el fin de superar la falta de variación significativa en los sistemas actuales. El enfoque induce diversidad directamente a nivel textual en lugar de depender de variaciones estocásticas dentro del modelo.

arxiv arXiv cs.LG · hace 5 h

CoorDex: Coordinar los sesgos de cuerpo y mano para la locomoción-manipulación continua diestra en humanoides

Los autores presentan CoorDex, una tubería de aprendizaje que permite la manipulación diestra de alto grado de libertad en humanoides móviles al convertir el control del cuerpo y la mano en un control residual latente coordinado. Este enfoque permite que el humanoide Unitree G1 realice tareas complejas como agarrar botellas sin parar y abrir puertas de refrigerador mientras se mueve.

arxiv arXiv cs.LG · hace 5 h

AutoDex: Un sistema automatizado del mundo real para la recopilación de datos de agarre diestro

AutoDex es un sistema automatizado diseñado para cerrar el ciclo de la recopilación de datos de agarre diestro en el mundo real, gestionando la percepción, la ejecución, la etiquetación y el reinicio sin intervención humana. Aborda los problemas de escalabilidad de la teleoperación y la falta de certificación física en simulación generando candidatos de agarre y verificándolos en hardware real.

Problema abierto: ¿Es efectivo AdamW bajo ruido de cola pesada?

Navegación semántica: diversidad controlable para la generación de imágenes

CoorDex: Coordinar los sesgos de cuerpo y mano para la locomoción-manipulación continua diestra en humanoides

AutoDex: Un sistema automatizado del mundo real para la recopilación de datos de agarre diestro

Redes Neuronales Físicamente Informadas de Física Dura-Blanda Adaptativas para la Resolución Robusta de EDP con Restricciones en los Límites

Repensando las Backdoors de Grafos Moleculares bajo Admisión Consciente de la Química

Medición y mitigación del sobreajuste en modelos de lenguaje grandes para tribunales multilingües de derecho penal

Transformers basados en energía como predictores de la dificultad de lectura

Diffusion-LLM consciente de la distribución para pronóstico robusto de series temporales a ultra largo plazo

Localización automatizada de fallos semánticos en SysML v2 mediante LLMs aumentados con grafos de conocimiento

Litmus: Especificación de métricas impulsada por código y sin etiquetas para evaluar sistemas de IA

ReasoningLens: Visualización jerárquica y auditoría diagnóstica para modelos de razonamiento grandes

HyperQuant: Una canalización de cuantización óptima en tasa-distorsión para modelos grandes de lenguaje y difusión

Detección de habilidades maliciosas de agentes en entornos reales mediante atención

Humanismo digital y diseño evolutivo

GRINQH: Jerarquía de Cuantización Basada en Entrada Graduada para Generación Eficiente de LLM

STAITUS: Desacoplar Apariencia y Pose para Seguimiento de Objetos en Vídeo

Mezcla de Expertos Multiarquitectónica con Enrutamiento Suave Adaptativo para la Clasificación de Enfermedades en Hojas de Plantas

SPIRAL: Aprender a buscar y agregar

¿Qué sabe un modelo de lenguaje químico sobre las moléculas?