Todos los artículos
media Latent Space · hace 2 h

Satya Nadella sobre Loopcraft y ecosistemas de vanguardia

El CEO de Microsoft, Satya Nadella, presenta 'Loopcraft' como una nueva teoría de la empresa, enfatizando que la verdadera oportunidad en la IA no radica en seleccionar el mejor modelo, sino en construir bucles de aprendizaje que acumulen capital humano y de tokens. Afirma que la prioridad debe ser crear ecosistemas de vanguardia donde cada organización pueda poseer y desarrollar su conocimiento institucional, permitiendo un amplio flujo de valor a través de industrias y países.

arxiv arXiv cs.LG · hace 2 h

CEAP reduce la varianza en el descubrimiento de circuitos de LLM

CEAP, un nuevo método de descubrimiento de circuitos, reduce sustancialmente la varianza de remuestreo en comparación con EAP-IG. El artículo muestra que la varianza por reformulación surge porque las plantillas de prompt activan diferentes circuitos, lo que sugiere que los LLM son inherentemente difíciles de dirigir a través de entradas diversas. La varianza por muestra es en gran medida benigna, ya que los puntajes bajos de fidelidad se deben al escalado selectivo de contribuciones, no a defectos del circuito.

arxiv arXiv cs.LG · hace 2 h

Descenso de gradiente funcional adaptativo con garantías de convergencia

Proponemos un nuevo algoritmo de descenso de gradiente funcional que adapta su representación durante la optimización. El método logra converger a un punto estacionario bajo pérdidas suaves y a un minimizador global bajo suavidad y una condición de Polyak-Lojasiewicz, a pesar de usar aproximaciones de dimensión finita. Supera tanto al FGD con aproximación fija como a las líneas base de redes neuronales en tareas de regresión, resolución de EDP y visión por computadora.

arxiv arXiv cs.LG · hace 2 h

Taxonomía unificada de origen causal de los cambios de distribución en el aprendizaje por refuerzo

Este artículo propone una taxonomía unificada de origen causal para los cambios de distribución en el aprendizaje por refuerzo, vinculando la generalización ID/OOD con entornos no estacionarios. Descompone la interacción agente-entorno utilizando un marco POMDP, identificando cambios internos impulsados por el agente y externos impulsados por el entorno, con tipos explícitos, implícitos e híbridos definidos por el límite de tiempo desplazado. El trabajo introduce un marco de evaluación para medir el impacto del cambio a través de métricas de degradación y recuperación del rendimiento, permitiendo un análisis sistemático de la robustez del RL.

arxiv arXiv cs.LG · hace 2 h

Propiedades clave para el razonamiento efectivo del intérprete de código

Un estudio identifica propiedades extrínsecas (tokens cruciales) e intrínsecas (comportamientos cognitivos) que mejoran el razonamiento del intérprete de código en modelos de lenguaje grandes. Los modelos con razonamiento más fuerte muestran una mayor prevalencia de verificación, retroceso y encadenamiento hacia atrás, con estas propiedades mejorando el rendimiento durante la inferencia y el entrenamiento, reduciendo el sobre-pensamiento y aumentando la eficiencia de los tokens.

arxiv arXiv cs.LG · hace 2 h

CrossMaps: Mapeo semántico consciente de la confianza para la navegación de rovers

CrossMaps es una canalización de mapeo semántico en tiempo real y consciente de la confianza que utiliza datos RGB-D para crear mapas consultables por lenguaje. Integra incrustaciones CLIP multi-escala con una arquitectura de doble memoria—Memoria a Corto Plazo y Memoria a Largo Plazo—para agregar observaciones visuales y promover celdas coherentes y confiables como puntos de referencia semánticos persistentes. El sistema permite consultas en lenguaje natural para guiar la navegación del rover mediante mapas de calor semánticos.

arxiv arXiv cs.LG · hace 2 h

CircuitLasso: Aprendizaje de circuitos escalable para la interpretabilidad de LLM

CircuitLasso permite el aprendizaje de circuitos escalable en modelos de lenguaje grandes mediante el uso de regresión lineal dispersa. Recupera circuitos con precisión estructural comparable a los métodos más avanzados, pero con un costo computacional significativamente menor, y demuestra una propagación semántica interpretable por humanos a través de los componentes del modelo. Los circuitos aprendidos logran un rendimiento comparable en una tarea de generalización de dominio con un costo reducido.

arxiv arXiv cs.LG · hace 2 h

Mapeo del espacio latente para coordenadas moleculares interpretables a partir de señales de nanoporo

Un codificador contrastivo entrenado con señales simuladas mapea las señales de códigos de barras de ADN en un sistema de coordenadas moleculares interpretable. El método permite la identificación de moléculas con un solo paso, reduciendo el costo computacional en tres órdenes de magnitud y permitiendo la agrupación de datos entre dispositivos mientras permanece invariante a las condiciones de adquisición.

arxiv arXiv cs.LG · hace 2 h

VAE VAE convolucional híbrido para superficies de volatilidad cripto

Un autoencoder variacional convolucional entrenado en 6,034 superficies de opciones de Binance para BTC y ETH logra un RMSE de 0.94-1.56 puntos de volatilidad con una máscara del 10-50%. El predictor híbrido reduce el error de 7.00 a 0.83 puntos de volatilidad con una máscara del 50%, superando al re-ajuste paramétrico en patrones de huecos estructurados y detectando eventos anómalos del mercado sin supervisión.

arxiv arXiv cs.LG · hace 2 h

Las redes neuronales de tamaño fijo logran aproximación de Sobolev arbitraria

Una nueva función de activación permite que las redes neuronales de tamaño fijo aproximen cualquier función en los espacios de Sobolev $W^{s,\infty}((a,b)^d)$ con precisión arbitraria en la norma $W^{s-1,\infty}$. Los resultados utilizan activaciones elementales como EUAF y DUAF$_\infty$, con cotas explícitas de ancho y profundidad, y se extienden a variantes sigmoideas $\widetilde{\mathrm{DUAF}}_n$ que preservan la precisión para todo $1\leq s\leq n$.

arxiv arXiv cs.LG · hace 2 h

Aprendizaje de Residuos de Error de Tarea para Malabares con Cinco Pelotas en Robots Reales

Un enfoque de aprendizaje residual utilizando supervisión de error de tarea direccional logra malabares estables con cinco pelotas en robots reales, convergiendo desde el segundo intento. El sistema supera los tiempos de práctica humana y se basa tanto en retroalimentación direccional como en un prior informativo, demostrando que la actualización newtoniana con Jacobiano fijo es la más confiable.