Todos los artículos — korshunov.ai

Todos los artículos Página 1 / 12

Docker: Compilar la interfaz de usuario (#24794)

El proyecto Docker ha añadido soporte para compilar el componente de la interfaz de usuario. Esta actualización también incluye el uso de APP_VERSION existente en la configuración del contenedor.

github llama.cpp · hace 5 h

llama.cpp lanza b9724 con correcciones de errores y binarios multiplataforma

La versión b9724 de llama.cpp incluye varias correcciones de errores y mejoras, como arreglos en la compilación, evitación de desbordamientos en la función area() y una comprobación de integridad en get_u32().

github llama.cpp · hace 5 h

llama.cpp release b9723 añade soporte para Qwen3.5 y Qwen3.6 Eagle3

La versión b9723 de llama.cpp introduce soporte para los modelos Qwen3.5 y Qwen3.6 a través de Eagle3. La liberación incluye restauración diferida de puntos de control de frontera para modelos híbridos y actualizaciones en las convenciones de API y nomenclatura. Las compilaciones binarias están disponibles para las plataformas macOS, Linux, Android, Windows y openEuler, con opciones para CPU, Vulkan, OpenVINO, SYCL y ROCm.

github llama.cpp · hace 5 h

LLaMA.cpp Release b9722: Correcciones y Binarios Multiplataforma

La versión b9722 de LLaMA.cpp corrige un problema con el valor n_discard no validado en el manejo del contexto del servidor. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler, compatibles con diversas arquitecturas y marcos de aceleración como Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp versión b9718: selección de ranura consolidada y nuevos binarios

La versión b9718 de llama.cpp consolida la selección de ranuras en una única función, get_available_slot, mientras mantiene las comprobaciones de similitud LCP para las actualizaciones de la caché de prompts. El lanzamiento incluye compilaciones binarias para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware.

github llama.cpp · hace 5 h

llama.cpp lanza la versión b9721 disponible para múltiples plataformas

llama.cpp ha lanzado la versión b9721, ofreciendo binarios para macOS, Linux, Android, Windows y openEuler en varias arquitecturas. La versión incluye soporte para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP, junto con un paquete de interfaz de usuario dedicado. Una función para Apple Silicon con KleidiAI está actualmente desactivada.

github llama.cpp · hace 5 h

ggml-cpu añade soporte para colas K en MMA Q8/Q4 de Power10

ggml-cpu ahora admite colas K en la multiplicación matricial MMA Q8/Q4 de Power10, eliminando el requisito de que K sea divisible por kc. Esto permite que más cargas de trabajo utilicen el núcleo MMA y reduce la dependencia de mnpack.

github OpenAI Agents SDK · hace 5 h

Notas de la versión v0.17.6

La versión v0.17.6 añade guardrails de entrada para herramientas preaprobadas y datos personalizados solo para SDK en las salidas de herramientas. También aplica un contrato estricto compatible con JSON para las salidas de herramientas y suprime las advertencias innecesarias sobre espacios en blanco en los nombres de las herramientas. @siddiksawani realizó su primera contribución en esta versión.

github llama.cpp · hace 5 h

llama.cpp Release b9716 Adds Batching Support for InternVL

La versión b9716 de llama.cpp introduce soporte para procesamiento por lotes (batching) en InternVL, mejorando el rendimiento del modelo mediante un procesamiento eficiente por lotes. La versión incluye compilaciones binarias para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, OpenVINO, SYCL y ROCm.

github llama.cpp · hace 5 h

llama.cpp lanza b9713 con nuevos binarios y características

llama.cpp ha lanzado la versión b9713, añadiendo soporte de agrupamiento a mtmd-cli y pruebas de video. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp versión b9714 añade el encabezado X-Accel-Buffering y nuevos binarios

llama.cpp versión b9714 añade el encabezado "X-Accel-Buffering": "no" a los puntos de conexión de transmisión para evitar que Nginx almacene en búfer las respuestas, lo que resuelve problemas de transmisión con aplicaciones como el entorno de codificación Pi. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware.

github llama.cpp · hace 5 h

LLaMA.cpp Release b9715 Adds CUDA Col2Im 1D and Multiple Platform Binaries

La versión b9715 de LLaMA.cpp introduce soporte para CUDA en GGML_OP_COL2IM_1D, basándose en una implementación para CPU. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y marcos de aceleración, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9711: nuevos binarios y actualizaciones

llama.cpp lanza la versión b9711 con binarios actualizados para macOS, Linux, Android, Windows y openEuler. La liberación incluye soporte para ARM64, x64, Vulkan, ROCm, OpenVINO, SYCL e HIP, con binarios dedicados para aceleración de CPU y GPU. También está disponible un nuevo paquete de interfaz de usuario.

github llama.cpp · hace 5 h

llama.cpp libera b9712 que corrige la compilación de la UI con código fuente de solo lectura

La versión b9712 de llama.cpp incluye una corrección para problemas de compilación de la UI causados por archivos de código fuente de solo lectura. El lanzamiento proporciona binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

la versión b9707 de llama.cpp añade validación de esquemas y nuevos binarios

La versión b9707 de llama.cpp introduce validación de esquemas y mejoras en los mensajes de error. Incluye compilaciones binarias para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware.

github llama.cpp · hace 5 h

llama.cpp Release b9703: Actualizaciones y descargas de binarios

La versión b9703 de llama.cpp incluye una reestructuración del manejo de presets del servidor, eliminando el soporte para presets remotos de HF y funciones obsoletas. El lanzamiento proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9704: corrige el manejo de gramática inválida y añade nuevos binarios

La versión b9704 de llama.cpp ahora devuelve HTTP 400 para gramática inválida en lugar de descartar silenciosamente las restricciones. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y aceleradores de hardware, con soporte para Vulkan, ROCm, OpenVINO, SYCL y CUDA.

github llama.cpp · hace 5 h

llama.cpp Release b9702: Correcciones y nuevos binarios

La versión b9702 de llama.cpp incluye una corrección para que los argumentos del router no se reenvíen a las instancias secundarias. El lanzamiento proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9701: nuevo preprocesador y binarios multiplataforma

La versión b9701 de llama.cpp introduce un preprocesor refactorizado con una nueva característica mtmd_image_preproc_out y documentación actualizada para desarrolladores. La liberación incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9700: nuevos binarios y actualizaciones de la API SYCL

La versión b9700 de llama.cpp introduce soporte SYCL actualizado con banderas de API renombradas: GGML_SYCL_SUPPORT_LEVEL_ZERO se ha renombrado a GGML_SYCL_SUPPORT_LEVEL_ZERO_API y GGML_SYCL_ENABLE_LEVEL_ZERO se ha renombrado a GGML_SYCL_USE_LEVEL_ZERO_API. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.