v0.24.0rc2: Corrección de P/D con el Supervisor DP (#46628)
Esta versión candidata aborda una corrección para la funcionalidad de Prefill/Decode (P/D) en conjunto con el Supervisor de Paralelismo de Datos (DP) dentro del proyecto vLLM.
Esta versión candidata aborda una corrección para la funcionalidad de Prefill/Decode (P/D) en conjunto con el Supervisor de Paralelismo de Datos (DP) dentro del proyecto vLLM.
La versión 2.1.191 de Claude Code introduce soporte para /rewind, lo que permite a los usuarios reanudar conversaciones desde antes de que se ejecutara un comando /clear. La actualización corrige varios problemas críticos, incluidos agentes en segundo plano que revivían después de ser detenidos y saltos en la posición del desplazamiento durante las respuestas en streaming. También corrige el comportamiento donde /voice mostraba mensajes de error genéricos y donde las URL de /login se truncaban en Windows Terminal. Mejoras significativas aumentan la fiabilidad para los servidores MCP añadiendo lógica de reintento para errores de red transitorios durante el descubrimiento de capacidades y flujos OAuth. Los entornos headless ahora omiten ventanas emergentes de navegador para OAuth, mientras que los permisos de red del sandbox se recuerdan durante la duración de la sesión. Las optimizaciones de rendimiento reducen el uso de CPU durante el streaming en aproximadamente un 37 % mediante la coalescencia de actualizaciones de texto y mitigan el crecimiento de memoria en sesiones largas desde la caché de salida del terminal.
La versión 2.1.190 incluye correcciones de errores y mejoras de fiabilidad. No se anuncian nuevas características en esta actualización.
vllm lanza v0.24.0rc1, que incluye una corrección para los problemas de compilación del histograma topk en SM75. El cambio se ha extraído (cherry-picked) del commit 191826e y está firmado por Mohammad Miadh Angkad.
Claude v2.1.187 introduce el bloqueo de credenciales del sandbox, restricciones de modelos configuradas por la organización, soporte para clics del mouse en pantalla completa y correcciones para fallos de comandos, bloqueos de herramientas y estabilidad de la interfaz de usuario. Las actualizaciones también mejoran el manejo de salidas estructuradas, el seguimiento de la profundidad del agente y la gestión de complementos, con mejoras en la compatibilidad con VSCode y la terminal.
Claude v2.1.186 añade comandos de autenticación CLI para servidores MCP, filtrado de estado en flujos de trabajo y una sección "Habilidades" en la configuración de complementos. Incluye numerosas correcciones de errores para la interfaz de usuario, la gestión de sesiones y el comportamiento del agente, junto con mejoras en el análisis de YAML, la gestión de memoria y la validación de herramientas.
El indicador de bloqueo de transmisión ahora muestra "Esperando respuesta de la API · se reintentará en …" y se activa después de 20 segundos de silencio, reemplazando el mensaje y el retraso anteriores.
v2.1.183 mejora la seguridad del modo automático bloqueando comandos destructivos de git y destroy sin consentimiento explícito del usuario. Añade advertencias de desuso para modelos, introduce attribution.sessionUrl para ocultar los enlaces de sesión y corrige múltiples problemas, incluido el comportamiento de la terminal, el rendimiento del subagente y el manejo de entradas en entornos web y tmux.
LangGraph lanza la versión 1.2.6, corrigiendo una regresión en la que los subgrafos anidados heredaban incorrectamente el checkpoint_ns del padre. La actualización también mejora la cancelación de subgrafos en ejecución durante abortes de transmisión e incluye una actualización de la versión de CLI a 0.4.30.
Claude Code v2.1.181 introduce soporte para configurar ajustes mediante sintaxis de prompt como /config thinking=false, añade soporte para eventos Apple en sandbox en macOS y mejora el streaming, el reintento automático y el comportamiento del subagente. También corrige numerosos errores relacionados con el inicio, el manejo de archivos, el portapapeles y la respuesta de la interfaz de usuario en todas las plataformas.
v2.1.179 corrige las caídas de conexión en medio del flujo, los problemas de desplazamiento con la rueda del ratón en WSL2 y un error en el patrón glob del sandbox que causaba descripciones excesivas de herramientas Bash. También resuelve errores en la encuesta de retroalimentación, el apilamiento de banners promocionales y problemas de enfoque en las vistas de subagente, mientras mejora la carga de complementos en sesiones remotas.
Una encuesta global de 81 usuarios de IA de 22 países reveló que el 89,5% de los hablantes no nativos de inglés cambian al inglés al utilizar IA, citando la precisión percibida. Más de un tercio informó que la IA falla en comprender sus culturas, con el 63% experimentando violaciones de normas culturales, incluidas narrativas centradas en Occidente y formalidad inapropiada. Los participantes expresaron preocupación de que la IA marginalice aún más sus culturas, con el 67% de acuerdo en que la IA reducirá la diversidad cultural a estereotipos en el futuro.
La versión 0.4.30 de langgraph-cli ya está disponible, con soporte para rangos de versiones de API compatibles. El lanzamiento también incluye estructuras de README.md estandarizadas para una mejor consistencia en la documentación.
Claude v2.1.178 introduce nuevas reglas de permisos utilizando la sintaxis Tool(param:value), mejora la carga de flujos de trabajo y habilidades en directorios anidados, y optimiza el modo automático y los mensajes de error. Corrige problemas críticos como bloqueos, errores de autenticación y comportamiento de la interfaz de usuario en Chrome y VSCode, mientras refina las indicaciones de las herramientas y la funcionalidad de deshacer.
Este artículo describe un método para automatizar el mantenimiento de bifurcaciones de software mediante agentes de codificación con IA, aplicándolo a la bifurcación de Cohere de vLLM. El enfoque comprime el tiempo necesario para absorber las versiones principales de semanas a días, reemplazando la intervención manual con un bucle de retroalimentación automatizado.
Los investigadores han desarrollado Pruebas Causales Generativas (GCT), un marco que traduce modelos de predicción cerebral basados en LLMs ininterpretables en hipótesis verbales concisas y comprobables sobre la función cortical. Este método condensa los parámetros del modelo en frases cortas que describen a qué responden regiones cerebrales específicas, como "preparación de alimentos", y luego verifica estas explicaciones mediante experimentos de fMRI dirigidos.
Google Finance está dejando oficialmente su fase beta y lanzando una aplicación dedicada para dispositivos Android.
Cohere desarrolló un agente de seguridad utilizando su plataforma de IA empresarial, Cohere North, integrada con la plataforma de seguridad en la nube Wiz a través de un servidor Model Context Protocol (MCP) personalizado. Esta arquitectura conecta North con la API GraphQL de Wiz mediante ocho herramientas atómicas, lo que permite flujos de trabajo automatizados de respuesta a incidentes desde una única instrucción. El sistema realiza análisis del radio de explosión de combinaciones tóxicas evaluando cadenas de ataque y clasificando los riesgos según la exposición a Internet y los niveles de privilegio en aproximadamente 20 segundos. También automatiza la investigación de extremo a extremo al recuperar detalles de los problemas, crear tickets en Linear, actualizar el estado de Wiz y redactar informes estructurados de respuesta a incidentes. Además, una automatización programada semanalmente genera cada lunes por la mañana un resumen de la postura de seguridad sin intervención manual. Esta integración elimina el ciclo de triaje previo de 30 minutos a dos horas por hallazgo, permitiendo que los ingenieros se centren en evaluar las valoraciones en lugar de las alertas crudas.
Talos es una herramienta de código abierto que automatiza el reanálisis iterativo de datos genómicos para identificar diagnósticos de enfermedades raras. Logró una tasa de recuperación del 90% de los diagnósticos dentro del alcance con solo 1,3 variantes candidatas por paciente, y proporcionó 241 nuevos diagnósticos en 5.000 pacientes sin diagnóstico, con la mayoría de los nuevos hallazgos emergiendo dentro de los 32 días posteriores a la publicación de la evidencia.
Un estudio publicado en Nature revela que AMIE, un sistema de IA conversacional, tiene un rendimiento comparable al de los médicos de atención primaria en la gestión de condiciones de salud complejas.