Todos los artículos — korshunov.ai — noticias de ML

Todos los artículos Página 1 / 8

github llama.cpp · hace 2 h

ggml-cpu: Habilitar condicionalmente el backend POWER11 según el soporte del compilador

El proyecto ggml-cpu ahora habilita condicionalmente el backend POWER11 en ggml según el soporte del compilador para -mcpu=power11. Esto previene fallos de compilación en las toolchains actuales de GCC/Clang mientras mantiene la compatibilidad hacia adelante. Las actualizaciones a CMakeLists.txt apoyan este cambio, y se utiliza -mcpu=power10 tanto para las arquitecturas P10 como P11.

github llama.cpp · hace 3 h

llama.cpp Release b9692 Añade Nuevos Binarios y Correcciones

llama.cpp versión b9692 introduce nuevos binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas. La liberación incluye actualizaciones para soportar Vulkan, ROCm, OpenVINO, SYCL e HIP, con correcciones para eliminar el uso de la dimensión de lote en llava_uhd.

github llama.cpp · hace 3 h

El backend Metal añade soporte para f16 y bf16 al operador de concatenación

El backend Metal en llama.cpp se ha ampliado para admitir los tipos de tensor f16 y bf16 para el operador de concatenación, además del soporte existente para f32 e i32. Esta actualización incluye plantillas de kernel especializadas, obtenedores de canalización actualizados y un despacho de kernel basado en tipos mejorado, con la asistencia de pi:llama.cpp/Qwen3.6-27B.

github llama.cpp · hace 3 h

llama.cpp lanza b9690 con operador rope_back y binarios multiplataforma

La versión b9690 de llama.cpp introduce un operador rope_back implementado reutilizando kernels rope existentes con una constante de función para alternar la rotación hacia adelante/hacia atrás. El lanzamiento incluye binarios preconstruidos para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 3 h

llama.cpp Release b9687 Añade Nuevos Binarios y Correcciones

llama.cpp versión b9687 introduce nuevos binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas. El lanzamiento incluye soporte para Vulkan, ROCm, OpenVINO, SYCL e HIP, con actualizaciones para mejorar la validación de dispositivos y el rendimiento en el hardware disponible.

github llama.cpp · hace 3 h

llama.cpp lanza la versión b9688 con nuevas APIs y binarios multiplataforma

llama.cpp lanza la versión b9688, añadiendo APIs de gestión de modelos y actualizaciones en tiempo real mediante SSE. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler, compatibles con diversas arquitecturas y marcos de aceleración como Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 3 h

LLaMA.cpp Release b9685 Adds SYCL Dev2Dev Memcpy and Multiple Platform Binaries

La versión b9685 de LLaMA.cpp introduce la funcionalidad memcpy dev2dev basada en SYCL, moviendo GGML_SYCL_DEV2DEV_MEMCPY a una tabla en tiempo de ejecución y mejorando la detección de comunicación entre pares. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y APIs incluyendo Vulkan, ROCm, OpenVINO y SYCL (FP32/FP16).

github llama.cpp · hace 3 h

llama.cpp Release b9686: Corrige un segfault en prompts largos para Eagle3

La versión b9686 de llama.cpp corrige un error de segfault que ocurría con prompts largos en el modelo Eagle3. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 3 h

La versión b9684 de LLaMA.cpp añade conv_3d y binarios para múltiples plataformas

La versión b9684 de LLaMA.cpp introduce una nueva operación de convolución 3D (conv_3d) e incluye implementaciones optimizadas. La versión proporciona binarios precompilados para macOS, Linux, Android, Windows y openEuler en varias arquitecturas y opciones de aceleración de hardware, incluyendo SYCL, Vulkan, CUDA y OpenVINO.

github llama.cpp · hace 3 h

llama.cpp release b9682 añade soporte para Vulkan y nuevos binarios de plataforma

La versión b9682 de llama.cpp introduce soporte para Vulkan en Linux y Windows, habilitando la aceleración por GPU. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas, con opciones de CPU y GPU que incluyen CUDA, OpenVINO, SYCL y ROCm.

github llama.cpp · hace 3 h

llama.cpp Release b9677: Actualizaciones y Binarios Multiplataforma

La versión llama.cpp b9677 actualiza el registro para imponer max_capacity y elimina la lógica de expansión de cola. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, OpenVINO y SYCL.

github llama.cpp · hace 3 h

La versión b9678 de LLaMA.cpp añade optimizaciones y compilaciones multiplataforma

La versión b9678 de LLaMA.cpp incluye la optimización de mul_mat_f16_f32_l4 para la decodificación e introduce nuevas compilaciones para macOS, Linux, Android, Windows y openEuler. La versión ofrece soporte para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP en múltiples arquitecturas, con un paquete de interfaz de usuario dedicado disponible.

github llama.cpp · hace 3 h

LLaMA.cpp Release b9674: Corrige un error de memcpy asíncrono y añade nuevos binarios

La versión LLaMA.cpp b9674 corrige un error de uso después de liberar en el memcpy asíncrono de SYCL durante la prellenado de MoE. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler, compatibles con CPU, Vulkan, ROCm, OpenVINO, SYCL y CUDA en múltiples arquitecturas.

github llama.cpp · hace 3 h

llama.cpp release b9675 añade soporte para FP16 y nuevos binarios de plataforma

la versión b9675 de llama.cpp habilita el soporte para FP16 en operaciones como SQR, SQRT, LOG, SIN, COS y CLAMP. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas, con soporte para Vulkan, ROCm, OpenVINO, SYCL (FP16 y FP32), y CUDA 12.4 y 13.3.

github llama.cpp · hace 3 h

llama.cpp libera b9680: nuevos binarios y soporte para Vulkan

llama.cpp lanza la versión b9680 con soporte actualizado para Vulkan y nuevos binarios para macOS, Linux, Android, Windows y openEuler. La liberación incluye variantes de CPU y GPU para múltiples arquitecturas, con soporte para Vulkan, CUDA, OpenVINO, SYCL y ROCm.

github llama.cpp · hace 3 h

llama.cpp lanza b9673 con asignaciones de sistema USM y binarios multiplataforma

La versión b9673 de llama.cpp introduce asignaciones de sistema USM opcionales para búferes de GPU ≥1GB, lo que permite el sobrecompromiso de VRAM cuando el dispositivo lo soporta. La función requiere la variable de entorno GGML_SYCL_USM_SYSTEM y está desactivada por defecto, volviendo a las asignaciones regulares si no es compatible.

github llama.cpp · hace 3 h

llama.cpp lanza b9660 con correcciones y nuevos binarios

llama.cpp lanza la versión b9660, corrigiendo el doble-escapeo en el análisis de llamadas a herramientas LFM2. La actualización incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, con un paquete de interfaz de usuario dedicado.

github llama.cpp · hace 3 h

llama.cpp lanza la versión b9672 con actualización de BoringSSL

llama.cpp ha lanzado la versión b9672, actualizando BoringSSL a 0.20260616.0. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración por hardware, incluyendo Vulkan, CUDA, ROCm, OpenVINO y SYCL.

github llama.cpp · hace 3 h

llama.cpp Release b9670: Correcciones y nuevas compilaciones

La versión b9670 de llama.cpp incluye correcciones para casos límite de NVFP4 en llama-graph, como el movimiento de operaciones MUL post-GEMM y la restricción de build_ffn a combinaciones admitidas. La versión proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de backend, incluyendo CUDA, Vulkan, SYCL y OpenVINO.

github llama.cpp · hace 3 h

llama.cpp lanza b96669 con muestreo de backend para Eagle3

la versión b9669 de llama.cpp añade soporte de muestreo de backend para Eagle3. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, CUDA, ROCm, OpenVINO y SYCL.