Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 129

Aumenta el rendimiento de inferencia hasta 15x en NVIDIA Blackwell usando descodificación especulativa DFlash

NVIDIA introduce la descodificación especulativa DFlash para impulsar significativamente el rendimiento de inferencia en su arquitectura Blackwell, abordando los desafíos de latencia inherentes a los LLMs autoregresivos.

lab NVIDIA Technical Blog · hace 2 d

Construye un científico de IA para el descubrimiento en ciencias de la vida con el kit de herramientas BioNeMo Agent de NVIDIA

NVIDIA presenta el kit de herramientas BioNeMo Agent para facilitar la creación de científicos de IA capaces de leer artículos, escribir código y generar hipótesis para el descubrimiento en ciencias de la vida.

lab NVIDIA Technical Blog · hace 2 d

Cómo las telecomunicaciones construyen redes autónomas con IA agente

Los operadores de telecomunicaciones están adoptando la IA en las operaciones de red, la atención al cliente y los flujos de trabajo de back-office, pero la mayoría aún se encuentra en etapas tempranas de su camino hacia la autonomía completa. Los esfuerzos actuales de automatización generalmente operan en el Nivel 2–3 de la taxonomía de TM Forum, centrándose en optimizar soluciones predefinidas dentro de dominios selectivos.

media Latent Space · hace 2 d

Los ingresos de Neocloud de SpaceX alcanzan los 28 mil millones de dólares anuales en medio de actualizaciones de OpenAI y Sakana

SpaceX ha asegurado su tercer acuerdo de alquiler de GPU con Reflection AI, elevando sus ingresos anualizados a aproximadamente 28 mil millones de dólares, basado en una tasa calculada de más de 10 dólares por hora para las GPUs Blackwell. Esta valoración es aproximadamente el doble que la de Coreweave, destacando el rápido crecimiento y el alto poder de fijación de precios en el mercado de infraestructura de IA.

media AI News (smol.ai) · hace 2 d

OpenAI expande Daybreak, Sakana lanza Fugu y GLM-5.2 gana tracción

Las noticias de IA de esta semana destacan la expansión de las iniciativas de ciberseguridad de OpenAI, el lanzamiento por parte de Sakana AI de un modelo de orquestación llamado Fugu y la creciente adopción del modelo de pesos abiertos GLM-5.2.

arxiv arXiv cs.LG · hace 2 d

Aprovechar las similitudes en los bandits de brazos múltiples

Este estudio investiga el aprendizaje en línea con conjuntos de acciones estructurados por similitud codificados mediante árboles enraizados, demostrando que la retroalimentación estándar de un solo punto no puede explotar estas similitudes. Los autores proponen algoritmos unificados para modelos de retroalimentación más ricos que reemplazan el número de acciones por un conteo efectivo consciente de la similitud para mejorar los límites de arrepentimiento.

arxiv arXiv cs.LG · hace 2 d

GRINQH: Jerarquía de Cuantificación Basada en Entrada Graduada para Generación Eficiente de LLM

Los investigadores proponen GRINQH, un marco de cuantización post-entrenamiento solo de pesos que acelera la decodificación de modelos de lenguaje grandes al unificar la cuantificación y la esparsificación. El método asigna dinámicamente los canales de peso a diferentes niveles de precisión basándose en las magnitudes de activación, abordando la naturaleza limitada por memoria de la etapa de decodificación.

arxiv arXiv cs.LG · hace 3 d

LoadKAN: Red de Kolmogorov-Arnold interpretable para la predicción de carga eléctrica

Este estudio presenta LoadKAN, un nuevo marco híbrido que combina un mecanismo de atención temporal aislado por características con una red de Kolmogorov-Arnold (KAN) para abordar la falta de interpretabilidad en la predicción de carga eléctrica basada en aprendizaje profundo.

arxiv arXiv cs.LG · hace 3 d

STAITUS: Desacoplar Apariencia y Pose para Seguimiento de Objetos en Vídeo

El artículo presenta STAITUS, un marco unificado para el seguimiento no supervisado de objetos en vídeo que aborda las limitaciones de las representaciones basadas en slots existentes al desacoplar explícitamente la apariencia de la pose geométrica. Al aplicar la alineación temporal únicamente en el espacio de apariencia y forzando la separación espacial dentro de los fotogramas, el método evita que los slots se fijen en fondos estáticos durante el movimiento.

arxiv arXiv cs.LG · hace 3 d

¿Qué sabe un modelo de lenguaje químico sobre las moléculas?

Este estudio aplica autoencoders dispersos a MolFormer para examinar mecánicamente cómo se construyen las representaciones moleculares a través de las capas, desafiando la suposición de que los modelos de lenguaje químicos solo aprenden la sintaxis superficial.

arxiv arXiv cs.LG · hace 3 d

SkyJEPA: Aprendizaje de modelos del mundo a largo plazo para el control de cuadricópteros con transferencia cero-shot de simulación a realidad

Este trabajo presenta SkyJEPA, un modelo al estilo JEPA diseñado para el control en tiempo real de cuadricópteros que aborda los problemas de amplificación de errores inherentes a la predicción autoregresiva a largo plazo. El enfoque combina un modelo de dinámica latente con un prober inspirado en la física para mapear latentes congelados a estados interpretables, permitiendo predicciones fundamentadas físicamente.

arxiv arXiv cs.LG · hace 3 d

Operadores efectivos colapsados para estructuras de orden superior

Los autores presentan los Operadores Efectivos Colapsados, un método que condensa los grados de libertad de orden superior en un único operador a nivel de vértice mediante la complementación de Schur de un Laplaciano graduado. Este enfoque produce un operador denso que codifica interacciones de largo alcance mediadas por topología y es aplicable a construcciones arbitrarias de orden superior.

arxiv arXiv cs.LG · hace 3 d

Pronóstico selectivo de series temporales mediante metaaprendizaje

Este artículo presenta un marco de pronóstico selectivo que permite a los modelos abstenerse de realizar predicciones de alto riesgo al modelar el percentil empírico de los errores de pronóstico mediante metaaprendizaje. Al utilizar estadísticas invariantes a la escala derivadas de rezagos recientes, el método desacopla las decisiones de rechazo de los pronósticos para habilitar la transferencia entre series temporales heterogéneas.

arxiv arXiv cs.LG · hace 3 d

¿Los codificadores de ubicación capturan efectos espaciales? Una evaluación de GeoShapley a través de escalas

Este estudio evalúa si GeoShapley, un explicador basado en teoría de juegos, puede recuperar coeficientes variables espacialmente de modelos de aprendizaje automático utilizando incrustaciones de codificadores de ubicación. Once codificadores del marco TorchSpatial fueron evaluados frente a un proceso sintético con coeficientes conocidos en escalas de cuadrícula, condado y global.

arxiv arXiv cs.LG · hace 3 d

Clasificación de series temporales mediante deformación temporal difeomórfica (DiffTW)

El artículo presenta la Deformación Temporal Difeomórfica (DiffTW), un marco teórico para la clasificación de series temporales que aprende mapeos entre funciones de valores reales para superar las limitaciones del emparejamiento discreto de puntos de la Deformación Temporal Dinámica (DTW). DiffTW aproxima transformaciones difeomórficas utilizando el método de características para resolver ecuaciones de transporte lineales, proporcionando una medida de disimilitud con fundamentos teóricos.

arxiv arXiv cs.LG · hace 3 d

Las Redes Neuronales Profundas con Estructura Sublineal Logran Coherencia en el Aprendizaje de Características para Funciones Composicionales

Este estudio establece garantías de coherencia en el aprendizaje de características para una amplia subclase de redes neuronales profundas caracterizadas por un crecimiento sublineal en las dimensiones de entrada/salida y en las neuronas ocultas en relación con el tamaño de la muestra. Los autores demuestran que estas arquitecturas logran aproximación universal para funciones composicionales jerárquicas, incluso dentro del régimen sobreparametrizado convencional donde los parámetros superan a las muestras de entrenamiento.

arxiv arXiv cs.LG · hace 3 d

TROPT: Un marco abierto para unificar y avanzar la optimización de texto discreto

Se presenta TROPT como el primer marco de código abierto que unifica la optimización de disparadores de texto discreto, estandarizando la ejecución y el desarrollo bajo una única interfaz. Aborda la fragmentación actual permitiendo a los usuarios personalizar recetas de optimización de extremo a extremo mediante modelos, objetivos y optimizadores intercambiables.

arxiv arXiv cs.LG · hace 3 d

FLKit: Un kit de herramientas estructurado para la incorporación al aprendizaje federado en salud

FLKit es un kit de herramientas de incorporación abierto y mantenido por la comunidad, diseñado para ayudar a equipos multidisciplinarios a navegar el ciclo de vida del aprendizaje federado en investigaciones de salud y ciencias de la vida. Proporciona puntos de entrada conscientes del rol para contribuyentes clínicos, legales, de gobernanza y técnicos, abordando las barreras prácticas de marcos dispersos y obligaciones de gobernanza.

arxiv arXiv cs.LG · hace 3 d

FairBED: Un enfoque de diseño experimental bayesiano para recopilar datos más justos

El artículo presenta FairBED, un marco que modifica el propio proceso de adquisición de datos para recopilar datos inherentemente más justos, abordando los sesgos presentes en los conjuntos de datos existentes. Proporciona formulaciones novedosas para cuantificar la equidad del conjunto de datos basadas en el principio de que los conjuntos de datos justos no deben ser informativos sobre los atributos sensibles.

arxiv arXiv cs.LG · hace 3 d

Concordia: Puntos de control persistentes con núcleo JIT-compilado para inferencia tolerante a fallos de LLM

Este artículo presenta Concordia, un entorno de ejecución diseñado para proporcionar tolerancia a fallos en agentes LLM de larga duración manteniendo el estado valioso en las GPUs sin reiniciar la pila de servicio. El sistema utiliza un núcleo persistente residente en el dispositivo que se interpone en la carga del módulo GPU para admitir instrumentación a nivel PTX y SASS.