Todos los artículos — korshunov.ai

Todos los artículos Página 2 / 130

Wmf: una nueva técnica experimental

El contenido del artículo ha sido eliminado por el autor, sin dejar información sustantiva sobre la técnica.

LLM local en MacBook M5 Pro - ¡Totalmente nuevo en esto!

Un no programador comparte su experiencia configurando una infraestructura de Modelo de Lenguaje Grande local en un MacBook M5 Max con 128GB de memoria unificada. El usuario detalla su pila de software, selecciones de modelos y objetivos para aprender IA mientras establece un sistema estable y accesible remotamente.

media Together AI Blog · hace 6 h

Together AI en ICML 2026: investigación de vanguardia en todo el stack

Together AI presenta nueve artículos en ICML 2026 que cubren todo el stack del desarrollo de su plataforma.

lab Hugging Face Blog · hace 6 h

ScarfBench: Evaluación de Agentes IA para la Migración a Marcos de Enterprise Java

Este artículo presenta ScarfBench, un benchmark diseñado para evaluar el rendimiento de agentes IA en la migración de aplicaciones empresariales Java entre diferentes marcos. El estudio destaca la complejidad de la migración de marcos y propone un método de evaluación estandarizado para evaluar las capacidades de los agentes en este dominio.

github CrewAI · hace 8 h

Notas de la versión 1.15.2a1 de crewAI

La versión 1.15.2a1 de crewAI introduce varias características nuevas, correcciones de errores y actualizaciones de documentación para el marco de orquestación de agentes.

github llama.cpp · hace 20 h

Lanzamiento de llama.cpp b9856 con restrict de CUDA + PDL para FA

El proyecto llama.cpp ha lanzado la versión b9856, introduciendo el uso consistente de la palabra clave `restrict` y PDL para Flash Attention en CUDA. Esta actualización viene acompañada de binarios precompilados para macOS, Linux, Android, Windows y openEuler a través de varios backends de hardware.

github llama.cpp · hace 23 h

Eliminar el respaldo de navegación de PWA para evitar el almacenamiento en caché de solicitudes de puntos finales de la API

La actualización elimina el mecanismo de respaldo de navegación de la Aplicación Web Progresiva (PWA). Este cambio se implementa específicamente para evitar el almacenamiento en caché no intencionado de solicitudes de puntos finales de la API.

github llama.cpp · hace 23 h

la versión b9852 de llama.cpp añade soporte para q1_0 con OpenCL

El proyecto llama.cpp ha lanzado la versión b9852, introduciendo soporte inicial de OpenCL para el formato de cuantización q1_0. Esta actualización incluye capacidades generales de q1_0 e implementaciones específicas de GEMM/GEMV para Adreno en dispositivos con OpenCL.

lab Anthropic News · hace 1 d

Anthropic vuelve a desplegar Fable 5 tras las normas de exportación de EE.UU.

Anthropic está restaurando el acceso global a sus modelos Claude Fable 5 y Mythos 5 después de que el gobierno de EE. UU. levantara las restricciones de exportación que habían suspendido la disponibilidad para todos los usuarios. Fable 5 estará disponible a nivel mundial a partir del 1 de julio en la Plataforma Claude, con límites de uso aplicables hasta el 7 de julio antes de cambiar al acceso basado en créditos.

github llama.cpp · hace 1 d

la versión b9851 de llama.cpp corrige la truncación entera de CUDA y proporciona binarios

El proyecto llama.cpp ha lanzado la versión b9851, que incluye una corrección para CUDA que previene errores de truncamiento entero y desbordamiento en el kernel flash_attn_mask_to_KV_max. Esta actualización aborda problemas relacionados con los pasos de la máscara KQ dentro del kernel especificado.

github llama.cpp · hace 1 d

Liberación de llama.cpp b9850: correcciones para Qwen3 y nuevos binarios

La liberación de llama.cpp b9850 introduce actualizaciones específicas de soporte para modelos, incluyendo el registro del tensor t_layer_inp para Qwen3Next, la corrección de la asignación de entrada en el bucle de procesamiento de capas y la resolución de problemas con DFLASH para qwen-coder-next. También añade un tensor para la normalización de atención en el modelo Qwen3.

github MCP (GitHub org) · hace 1 d

MCP Python SDK v2.0.0b1 lanzado con soporte completo para la especificación 2026

El SDK de Python del Protocolo de Contexto del Modelo (MCP) ha lanzado su primera versión beta, v2.0.0b1, que introduce soporte completo para la especificación MCP 2026-07-28. Esta versión preliminar es solo mediante opt-in, asegurando que las instalaciones estándar sigan resolviéndose hacia la línea estable 1.x.

lab Microsoft Research Blog · hace 1 d

SkillOpt: Habilidades de agente como parámetros entrenables

Microsoft Research presenta SkillOpt, un método que trata los archivos de habilidades del agente como parámetros entrenables fuera de un modelo objetivo congelado, transformando la edición manual de habilidades en un proceso de optimización controlada. Este enfoque mejora la fiabilidad y consistencia del agente sin actualizar los pesos del modelo subyacente.

lab Anthropic News · hace 2 d

Claude Science, un banco de trabajo de IA para científicos, ya está disponible

Anthropic ha lanzado Claude Science en beta, un banco de trabajo de IA diseñado para integrar herramientas científicas fragmentadas en un único entorno de investigación. La plataforma tiene como objetivo acelerar el descubrimiento proporcionando artefactos auditables, escalado flexible de recursos de cómputo y agentes especializados para dominios como la genómica y la biología estructural.

lab Anthropic News · hace 2 d

Presentando Claude Sonnet 5

Anthropic ha lanzado Claude Sonnet 5, un nuevo modelo de IA agéntica diseñado para realizar tareas complejas de planificación, uso de herramientas y codificación autónoma a un costo menor que los modelos anteriores de la clase Opus. La actualización reduce la brecha de rendimiento con Opus 4.8 mientras ofrece mejoras significativas en razonamiento, seguridad y ejecución respecto a su predecesor, Sonnet 4.6.

lab Claude Code Releases · hace 2 d

Claude Code v2.1.197 introduce Claude Sonnet 5

Anthropic ha lanzado la versión 2.1.197 de Claude Code, que actualiza el modelo predeterminado a Claude Sonnet 5. Este nuevo modelo cuenta con una ventana de contexto nativa de 1M tokens y está disponible con precios promocionales hasta el 31 de agosto.

lab OpenAI News · hace 2 d

Dentro de GeneBench-Pro: 10 estudios de caso de razonamiento genómico complejo

GeneBench-Pro es una prueba diseñada para evaluar modelos en tareas de razonamiento genómico complejo, con diez estudios de caso detallados que muestran preguntas representativas y materiales de apoyo. Cada estudio de caso proporciona la solicitud original, conjuntos de datos y el contexto necesario para evaluar el rendimiento del modelo en desafíos biológicos específicos.

lab OpenAI News · hace 2 d

Presentamos GeneBench-Pro

GeneBench-Pro es una evaluación a nivel de investigación diseñada para medir cómo los agentes de IA manejan la ambigüedad y toman decisiones trascendentales en biología computacional, ampliando el GeneBench original. Aborda la limitación de las evaluaciones actuales al probar capacidades de orden superior como manejar ruido en los datos, revisar supuestos y determinar cuándo los resultados están listos para la toma de decisiones.

lab OpenAI News · hace 2 d

Epidemiología de los volcados de núcleo: corrección de un error de 18 años

Los ingenieros de OpenAI resolvieron caídas inexplicables de C++ en su infraestructura de datos Rockset identificando dos causas distintas: corrupción silenciosa de hardware en un host de Azure y una condición de carrera de 18 años en GNU libunwind.

lab OpenAI News · hace 2 d

Cómo se ha expandido la adopción de ChatGPT

Los datos de OpenAI Signals revelan que la adopción de ChatGPT se está ampliando y profundizando a nivel global, con usuarios enviando un 50% más de mensajes diarios y duplicando el número de tareas distintas probadas seis meses después de registrarse.