Todos los artículos
github LlamaIndex · hace 2 h

Notas de la versión 0.14.23 de Llama Index

Llama Index lanzó la versión 0.14.23 el 24 de junio de 2026, introduciendo capacidades multimodales significativas y varias correcciones de errores. La actualización central incluye características de síntesis multimodal y la introducción de motores de consulta multimodales para admitir diversos tipos de datos. Las correcciones clave abordan el manejo de bloques de documentos y video dentro de las salidas de FunctionTool y aseguran que los bloques de memoria respaldados por URL se conserven correctamente. Se implementaron mejoras de rendimiento mediante el uso de conjuntos para la deduplicación dentro del lote en la canalización de ingestión y optimizando la lógica de división de texto de tokens. La versión también resuelve un ZeroDivisionError en secuencias de entrada vacías y corrige errores de recursión en los divisores cuando las unidades superan los tamaños de fragmento. Además, se agregó codificación UTF-8 explícita a las operaciones de E/S de archivos, y la copia profunda de los estados iniciales evita fugas de mutación entre ejecuciones del flujo de trabajo.

github AutoGPT · hace 3 h

autogpt-platform-beta-v0.6.64 lanzado

La versión autogpt-platform-beta-v0.6.64, fechada el 18 de junio de 2026, introduce nuevas características como el Panel de Contexto de AutoPilot y Búsqueda Global, junto con mejoras en el guardado de gráficos, caché y rendimiento del constructor. También incluye endurecimiento de seguridad, corrección de errores relacionados con proveedores de LLM y mejoras en la interfaz de usuario, como un icono táctil de alta resolución.

github llama.cpp · hace 3 h

llama.cpp b9788 añade paralelismo de tensores con SYCL para configuraciones de doble GPU

La versión b9788 de llama.cpp introduce soporte para el paralelismo de tensores mediante la bandera --split-mode tensor en el backend SYCL. Esta implementación permite la comunicación entre dos GPUs añadiendo las funciones comm_init, comm_free y comm_allreduce_tensor al meta-backend. Para dos dispositivos, utiliza una estrategia de all-reduce en anillo que alterna entre memcpy directo en FP32 para tensores pequeños y compresión BF16 para los más grandes. El código evita OneCCL debido a su limitación de un solo dispositivo por proceso, utilizando en su lugar búferes persistentes para mantener las invariantes del pool SYCL. Las pruebas de rendimiento en dos GPUs Intel Arc Pro B70 muestran aceleraciones significativas frente al modo de capa para los modelos Llama-3.3-70B y Qwen3-Coder-Next-80B-A3B. La actualización incluye nuevos binarios para macOS, Linux, Windows, Android y openEuler en objetivos de CPU, CUDA, ROCm, Vulkan y SYCL.