Todos los artículos
media Latent Space · hace 3 h

Los ingresos de Neocloud de SpaceX alcanzan los 28 mil millones de dólares anuales en medio de actualizaciones de OpenAI y Sakana

SpaceX ha asegurado su tercer acuerdo de alquiler de GPU con Reflection AI, elevando sus ingresos anualizados a aproximadamente 28 mil millones de dólares, basado en una tasa calculada de más de 10 dólares por hora para las GPUs Blackwell. Esta valoración es aproximadamente el doble que la de Coreweave, destacando el rápido crecimiento y el alto poder de fijación de precios en el mercado de infraestructura de IA.

lab Meta AI / FAIR Blog · hace 3 h

Brain2Qwerty v2 alcanza 61% de precisión en palabras en la descodificación no invasiva de cerebro a texto

Los investigadores han lanzado Brain2Qwerty v2, una pipeline de IA no invasiva que descodifica oraciones en tiempo real a partir de registros de magnetoencefalografía (MEG) sin implantes quirúrgicos. El sistema alcanza una tasa de precisión de palabras del 61% en general y hasta el 78% para los mejores participantes, superando significativamente a métodos no invasivos anteriores.

arxiv arXiv cs.LG · hace 4 h

Aprovechar las similitudes en los bandits de brazos múltiples

Este estudio investiga el aprendizaje en línea con conjuntos de acciones estructurados por similitud codificados mediante árboles enraizados, demostrando que la retroalimentación estándar de un solo punto no puede explotar estas similitudes. Los autores proponen algoritmos unificados para modelos de retroalimentación más ricos que reemplazan el número de acciones por un conteo efectivo consciente de la similitud para mejorar los límites de arrepentimiento.

arxiv arXiv cs.LG · hace 4 h

GRINQH: Jerarquía de Cuantificación Basada en Entrada Graduada para Generación Eficiente de LLM

Los investigadores proponen GRINQH, un marco de cuantización post-entrenamiento solo de pesos que acelera la decodificación de modelos de lenguaje grandes al unificar la cuantificación y la esparsificación. El método asigna dinámicamente los canales de peso a diferentes niveles de precisión basándose en las magnitudes de activación, abordando la naturaleza limitada por memoria de la etapa de decodificación.

arxiv arXiv cs.LG · hace 5 h

STAITUS: Desacoplar Apariencia y Pose para Seguimiento de Objetos en Vídeo

El artículo presenta STAITUS, un marco unificado para el seguimiento no supervisado de objetos en vídeo que aborda las limitaciones de las representaciones basadas en slots existentes al desacoplar explícitamente la apariencia de la pose geométrica. Al aplicar la alineación temporal únicamente en el espacio de apariencia y forzando la separación espacial dentro de los fotogramas, el método evita que los slots se fijen en fondos estáticos durante el movimiento.

arxiv arXiv cs.LG · hace 5 h

SkyJEPA: Aprendizaje de modelos del mundo a largo plazo para el control de cuadricópteros con transferencia cero-shot de simulación a realidad

Este trabajo presenta SkyJEPA, un modelo al estilo JEPA diseñado para el control en tiempo real de cuadricópteros que aborda los problemas de amplificación de errores inherentes a la predicción autoregresiva a largo plazo. El enfoque combina un modelo de dinámica latente con un prober inspirado en la física para mapear latentes congelados a estados interpretables, permitiendo predicciones fundamentadas físicamente.