Todos los artículos
arxiv arXiv cs.AI · hace 6 h

SAFARI: Escalar la atribución de fallos agénticos en horizontes largos mediante investigación activa

El artículo presenta SAFARI, un marco diseñado para diagnosticar fallos en agentes autónomos reemplazando la carga lineal del contexto con un bucle de diagnóstico aumentado por herramientas. Este enfoque desacopla la precisión del diagnóstico de los límites contextuales arquitecturales utilizando herramientas especializadas y memoria a corto plazo para analizar segmentos de trayectoria.

arxiv arXiv cs.AI · hace 6 h

Visualizar 'Nosotros el Pueblo': Cerrar la brecha de percepción mediante narrativas de datos pluralistas

Este artículo examina cómo las elecciones de diseño intencionales y pluralistas en plataformas digitales habilitadas por IA pueden producir visualizaciones que enfatizan los matices y las similitudes entre grupos, reduciendo así la polarización política. Destaca una iniciativa específica de tecnología deliberativa que mapea espacios de opinión de alta dimensión para revelar áreas tanto de consenso como de disenso entre poblaciones diversas.

arxiv arXiv cs.AI · hace 7 h

CineCap: Razonamiento estructurado con anclajes espaciotemporales para la descripción de videos cinematográficos

Los investigadores proponen CineCap, un marco que combina razonamiento estructurado con anclajes espaciotemporales y aprendizaje por refuerzo para mejorar la descripción de videos cinematográficos. El método fundamenta descripciones del lenguaje cinematográfico profesional en evidencia visual explícita, equilibrando la exhaustividad descriptiva y la corrección factual.

media AI News (smol.ai) · hace 7 h

Anthropic lanza Claude Tag, una herramienta de delegación asíncrona nativa para Slack

Anthropic ha lanzado Claude Tag, una nueva función de flujo de trabajo que permite a los equipos delegar tareas en Claude de forma asíncrona dentro de Slack. Posicionado como un cambio desde el chat individual hacia la colaboración en todo el equipo, la herramienta permite que Claude se una como miembro del equipo con acceso a canales seleccionados, herramientas y repositorios de código.

media r/LocalLLaMA · hace 7 h

La NASA prueba la inferencia de LLM local para futuras misiones espaciales

Investigadores de Red Hat y la NASA están desarrollando el Asistente Digital del Oficial Médico de la Tripulación (CMO-DA), un sistema de IA médica que ejecuta modelos de lenguaje grandes en hardware local con cero dependencia de la nube. Esta iniciativa aborda la inviabilidad de la telemedicina basada en la Tierra para astronautas en misiones a la Luna o Marte debido al retraso de luz y las interrupciones de comunicación.

lab NVIDIA Technical Blog · hace 8 h

Cómo las telecomunicaciones construyen redes autónomas con IA agente

Los operadores de telecomunicaciones están adoptando la IA en las operaciones de red, la atención al cliente y los flujos de trabajo de back-office, pero la mayoría aún se encuentra en etapas tempranas de su camino hacia la autonomía completa. Los esfuerzos actuales de automatización generalmente operan en el Nivel 2–3 de la taxonomía de TM Forum, centrándose en optimizar soluciones predefinidas dentro de dominios selectivos.

media Latent Space · hace 8 h

Los ingresos de Neocloud de SpaceX alcanzan los 28 mil millones de dólares anuales en medio de actualizaciones de OpenAI y Sakana

SpaceX ha asegurado su tercer acuerdo de alquiler de GPU con Reflection AI, elevando sus ingresos anualizados a aproximadamente 28 mil millones de dólares, basado en una tasa calculada de más de 10 dólares por hora para las GPUs Blackwell. Esta valoración es aproximadamente el doble que la de Coreweave, destacando el rápido crecimiento y el alto poder de fijación de precios en el mercado de infraestructura de IA.

lab Meta AI / FAIR Blog · hace 8 h

Brain2Qwerty v2 alcanza 61% de precisión en palabras en la descodificación no invasiva de cerebro a texto

Los investigadores han lanzado Brain2Qwerty v2, una pipeline de IA no invasiva que descodifica oraciones en tiempo real a partir de registros de magnetoencefalografía (MEG) sin implantes quirúrgicos. El sistema alcanza una tasa de precisión de palabras del 61% en general y hasta el 78% para los mejores participantes, superando significativamente a métodos no invasivos anteriores.