Wmf: una nueva técnica experimental
El contenido del artículo ha sido eliminado por el autor, sin dejar información sustantiva sobre la técnica.
El contenido del artículo ha sido eliminado por el autor, sin dejar información sustantiva sobre la técnica.
Un no programador comparte su experiencia configurando una infraestructura de Modelo de Lenguaje Grande local en un MacBook M5 Max con 128GB de memoria unificada. El usuario detalla su pila de software, selecciones de modelos y objetivos para aprender IA mientras establece un sistema estable y accesible remotamente.
Together AI presenta nueve artículos en ICML 2026 que cubren todo el stack del desarrollo de su plataforma.
Este artículo presenta ScarfBench, un benchmark diseñado para evaluar el rendimiento de agentes IA en la migración de aplicaciones empresariales Java entre diferentes marcos. El estudio destaca la complejidad de la migración de marcos y propone un método de evaluación estandarizado para evaluar las capacidades de los agentes en este dominio.
La versión 1.15.2a1 de crewAI introduce varias características nuevas, correcciones de errores y actualizaciones de documentación para el marco de orquestación de agentes.
El proyecto llama.cpp ha lanzado la versión b9856, introduciendo el uso consistente de la palabra clave `restrict` y PDL para Flash Attention en CUDA. Esta actualización viene acompañada de binarios precompilados para macOS, Linux, Android, Windows y openEuler a través de varios backends de hardware.
La actualización elimina el mecanismo de respaldo de navegación de la Aplicación Web Progresiva (PWA). Este cambio se implementa específicamente para evitar el almacenamiento en caché no intencionado de solicitudes de puntos finales de la API.
El proyecto llama.cpp ha lanzado la versión b9852, introduciendo soporte inicial de OpenCL para el formato de cuantización q1_0. Esta actualización incluye capacidades generales de q1_0 e implementaciones específicas de GEMM/GEMV para Adreno en dispositivos con OpenCL.
Anthropic está restaurando el acceso global a sus modelos Claude Fable 5 y Mythos 5 después de que el gobierno de EE. UU. levantara las restricciones de exportación que habían suspendido la disponibilidad para todos los usuarios. Fable 5 estará disponible a nivel mundial a partir del 1 de julio en la Plataforma Claude, con límites de uso aplicables hasta el 7 de julio antes de cambiar al acceso basado en créditos.
El proyecto llama.cpp ha lanzado la versión b9851, que incluye una corrección para CUDA que previene errores de truncamiento entero y desbordamiento en el kernel flash_attn_mask_to_KV_max. Esta actualización aborda problemas relacionados con los pasos de la máscara KQ dentro del kernel especificado.
La liberación de llama.cpp b9850 introduce actualizaciones específicas de soporte para modelos, incluyendo el registro del tensor t_layer_inp para Qwen3Next, la corrección de la asignación de entrada en el bucle de procesamiento de capas y la resolución de problemas con DFLASH para qwen-coder-next. También añade un tensor para la normalización de atención en el modelo Qwen3.
El SDK de Python del Protocolo de Contexto del Modelo (MCP) ha lanzado su primera versión beta, v2.0.0b1, que introduce soporte completo para la especificación MCP 2026-07-28. Esta versión preliminar es solo mediante opt-in, asegurando que las instalaciones estándar sigan resolviéndose hacia la línea estable 1.x.
Microsoft Research presenta SkillOpt, un método que trata los archivos de habilidades del agente como parámetros entrenables fuera de un modelo objetivo congelado, transformando la edición manual de habilidades en un proceso de optimización controlada. Este enfoque mejora la fiabilidad y consistencia del agente sin actualizar los pesos del modelo subyacente.
Anthropic ha lanzado Claude Science en beta, un banco de trabajo de IA diseñado para integrar herramientas científicas fragmentadas en un único entorno de investigación. La plataforma tiene como objetivo acelerar el descubrimiento proporcionando artefactos auditables, escalado flexible de recursos de cómputo y agentes especializados para dominios como la genómica y la biología estructural.
Anthropic ha lanzado Claude Sonnet 5, un nuevo modelo de IA agéntica diseñado para realizar tareas complejas de planificación, uso de herramientas y codificación autónoma a un costo menor que los modelos anteriores de la clase Opus. La actualización reduce la brecha de rendimiento con Opus 4.8 mientras ofrece mejoras significativas en razonamiento, seguridad y ejecución respecto a su predecesor, Sonnet 4.6.
Anthropic ha lanzado la versión 2.1.197 de Claude Code, que actualiza el modelo predeterminado a Claude Sonnet 5. Este nuevo modelo cuenta con una ventana de contexto nativa de 1M tokens y está disponible con precios promocionales hasta el 31 de agosto.
GeneBench-Pro es una prueba diseñada para evaluar modelos en tareas de razonamiento genómico complejo, con diez estudios de caso detallados que muestran preguntas representativas y materiales de apoyo. Cada estudio de caso proporciona la solicitud original, conjuntos de datos y el contexto necesario para evaluar el rendimiento del modelo en desafíos biológicos específicos.
GeneBench-Pro es una evaluación a nivel de investigación diseñada para medir cómo los agentes de IA manejan la ambigüedad y toman decisiones trascendentales en biología computacional, ampliando el GeneBench original. Aborda la limitación de las evaluaciones actuales al probar capacidades de orden superior como manejar ruido en los datos, revisar supuestos y determinar cuándo los resultados están listos para la toma de decisiones.
Los ingenieros de OpenAI resolvieron caídas inexplicables de C++ en su infraestructura de datos Rockset identificando dos causas distintas: corrupción silenciosa de hardware en un host de Azure y una condición de carrera de 18 años en GNU libunwind.
Los datos de OpenAI Signals revelan que la adopción de ChatGPT se está ampliando y profundizando a nivel global, con usuarios enviando un 50% más de mensajes diarios y duplicando el número de tareas distintas probadas seis meses después de registrarse.