Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 1 / 11

github llama.cpp · hace 5 h

llama.cpp Release b9716 Adds Batching Support for InternVL

La versión b9716 de llama.cpp introduce soporte para procesamiento por lotes (batching) en InternVL, mejorando el rendimiento del modelo mediante un procesamiento eficiente por lotes. La versión incluye compilaciones binarias para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, OpenVINO, SYCL y ROCm.

github llama.cpp · hace 5 h

llama.cpp lanza b9713 con nuevos binarios y características

llama.cpp ha lanzado la versión b9713, añadiendo soporte de agrupamiento a mtmd-cli y pruebas de video. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp versión b9714 añade el encabezado X-Accel-Buffering y nuevos binarios

llama.cpp versión b9714 añade el encabezado "X-Accel-Buffering": "no" a los puntos de conexión de transmisión para evitar que Nginx almacene en búfer las respuestas, lo que resuelve problemas de transmisión con aplicaciones como el entorno de codificación Pi. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware.

github llama.cpp · hace 5 h

LLaMA.cpp Release b9715 Adds CUDA Col2Im 1D and Multiple Platform Binaries

La versión b9715 de LLaMA.cpp introduce soporte para CUDA en GGML_OP_COL2IM_1D, basándose en una implementación para CPU. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y marcos de aceleración, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9711: nuevos binarios y actualizaciones

llama.cpp lanza la versión b9711 con binarios actualizados para macOS, Linux, Android, Windows y openEuler. La liberación incluye soporte para ARM64, x64, Vulkan, ROCm, OpenVINO, SYCL e HIP, con binarios dedicados para aceleración de CPU y GPU. También está disponible un nuevo paquete de interfaz de usuario.

github llama.cpp · hace 5 h

llama.cpp libera b9712 que corrige la compilación de la UI con código fuente de solo lectura

La versión b9712 de llama.cpp incluye una corrección para problemas de compilación de la UI causados por archivos de código fuente de solo lectura. El lanzamiento proporciona binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

la versión b9707 de llama.cpp añade validación de esquemas y nuevos binarios

La versión b9707 de llama.cpp introduce validación de esquemas y mejoras en los mensajes de error. Incluye compilaciones binarias para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware.

github llama.cpp · hace 5 h

llama.cpp Release b9703: Actualizaciones y descargas de binarios

La versión b9703 de llama.cpp incluye una reestructuración del manejo de presets del servidor, eliminando el soporte para presets remotos de HF y funciones obsoletas. El lanzamiento proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9704: corrige el manejo de gramática inválida y añade nuevos binarios

La versión b9704 de llama.cpp ahora devuelve HTTP 400 para gramática inválida en lugar de descartar silenciosamente las restricciones. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y aceleradores de hardware, con soporte para Vulkan, ROCm, OpenVINO, SYCL y CUDA.

github llama.cpp · hace 5 h

llama.cpp Release b9702: Correcciones y nuevos binarios

La versión b9702 de llama.cpp incluye una corrección para que los argumentos del router no se reenvíen a las instancias secundarias. El lanzamiento proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9701: nuevo preprocesador y binarios multiplataforma

La versión b9701 de llama.cpp introduce un preprocesor refactorizado con una nueva característica mtmd_image_preproc_out y documentación actualizada para desarrolladores. La liberación incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp libera b9700: nuevos binarios y actualizaciones de la API SYCL

La versión b9700 de llama.cpp introduce soporte SYCL actualizado con banderas de API renombradas: GGML_SYCL_SUPPORT_LEVEL_ZERO se ha renombrado a GGML_SYCL_SUPPORT_LEVEL_ZERO_API y GGML_SYCL_ENABLE_LEVEL_ZERO se ha renombrado a GGML_SYCL_USE_LEVEL_ZERO_API. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 5 h

LLaMA.cpp Release b9698 Adds Self-Update Support and Multiple Platform Binaries

La versión b9698 de LLaMA.cpp habilita las actualizaciones automáticas únicamente cuando se compila con llama-install.sh. La versión incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 5 h

llama.cpp Release b9699 Adds SYCL Support and Multiple Platform Binaries

La versión b9699 de llama.cpp introduce soporte para las operaciones MUL_MAT y OUT_PROD con precisión Q1_0 a través del PR #24721. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y marcos de aceleración, incluyendo SYCL (FP32 y FP16), Vulkan, CUDA, ROCm y OpenVINO.

github llama.cpp · hace 5 h

LLaMA.cpp lanza b9697: nuevos binarios y actualizaciones

LLaMA.cpp publica la versión b9697 con binarios actualizados para macOS, Linux, Android, Windows y openEuler. La publicación incluye soporte para ARM64, x64, Vulkan, CUDA 12 y 13, OpenVINO, SYCL y ROCm, junto con la corrección de un problema de análisis de mensajes en las comprobaciones de lanzamiento.

github llama.cpp · hace 5 h

llama.cpp Release b9693 Adds BF16 Support and Cross-Platform Binaries

La versión b9693 de llama.cpp introduce soporte para BF16 en su kernel de concatenación y proporciona binarios precompilados para macOS, Linux, Android, Windows y openEuler. La versión incluye variantes para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP en múltiples arquitecturas, con un paquete de interfaz de usuario dedicado disponible.

github llama.cpp · hace 5 h

llama.cpp lanza la versión b9694 con nuevos binarios para múltiples plataformas

llama.cpp ha lanzado la versión b9694, que incluye binarios para macOS, Linux, Android, Windows y openEuler. La versión es compatible con varias arquitecturas y opciones de aceleración como CUDA, Vulkan, OpenVINO, SYCL y ROCm. También se implementó una corrección para el enlace de la versión de OpenVINO en Windows x64.

github llama.cpp · hace 5 h

ggml-cpu: Habilitar condicionalmente el backend POWER11 según el soporte del compilador

El proyecto ggml-cpu ahora habilita condicionalmente el backend POWER11 en ggml según el soporte del compilador para -mcpu=power11. Esto previene fallos de compilación en las toolchains actuales de GCC/Clang mientras mantiene la compatibilidad hacia adelante. Las actualizaciones a CMakeLists.txt apoyan este cambio, y se utiliza -mcpu=power10 tanto para las arquitecturas P10 como P11.

github llama.cpp · hace 5 h

llama.cpp Release b9692 Añade Nuevos Binarios y Correcciones

llama.cpp versión b9692 introduce nuevos binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas. La liberación incluye actualizaciones para soportar Vulkan, ROCm, OpenVINO, SYCL e HIP, con correcciones para eliminar el uso de la dimensión de lote en llava_uhd.

github llama.cpp · hace 5 h

El backend Metal añade soporte para f16 y bf16 al operador de concatenación

El backend Metal en llama.cpp se ha ampliado para admitir los tipos de tensor f16 y bf16 para el operador de concatenación, además del soporte existente para f32 e i32. Esta actualización incluye plantillas de kernel especializadas, obtenedores de canalización actualizados y un despacho de kernel basado en tipos mejorado, con la asistencia de pi:llama.cpp/Qwen3.6-27B.