Branche de release créée pour v1.38.0
Une branche de release a été créée pour la version 1.38.0. Cela marque le début du processus de release pour la mise à jour.
Une branche de release a été créée pour la version 1.38.0. Cela marque le début du processus de release pour la mise à jour.
La version b96669 de llama.cpp ajoute le support de l'échantillonnage backend pour Eagle3. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.
La version llama.cpp b9670 inclut des corrections pour les cas limites NVFP4 dans llama-graph, notamment le déplacement des opérations MUL post-GEMM et la restriction de build_ffn aux combinaisons prises en charge. La version fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options de backend, y compris CUDA, Vulkan, SYCL et OpenVINO.
La version b9667 de llama.cpp introduit le support de Vulkan avec S_v=16 via gated_delta_net. Elle inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options pour Vulkan, CUDA 12.4 et 13.3, ROCm, OpenVINO et SYCL.
La version b9668 de llama.cpp implémente des tampons de mémoire visible hôte UMA pour de meilleures performances sur les appareils UMA, sur la suggestion de 0cc4m. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec un package UI dédié.
La version b9665 de llama.cpp introduit un nouveau drapeau --offline pour le benchmarking. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.
La version b9663 de LLaMA.cpp ajoute la prise en charge de OP EXPM1 et tous les cas de test unitaires pour FLOOR, TRUNC et ROUND. Elle inclut des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler, avec le support de SYCL (FP32 et FP16), Vulkan, CUDA 12.4 et 13.3, ainsi que ROCm 7.2, accompagnée d'une interface utilisateur mise à jour.
La mise à jour sycl étend la prise en charge de la gestion des tenseurs d'experts réordonnés dans MoE MUL_MAT_ID à Q4_K, Q5_K et Q6_K. Les cas de réorganisation 3D non pris en charge basculent maintenant vers un fallback au lieu de provoquer un abort.
La version b9661 de llama.cpp ajoute le support GGML_OP_COL2IM_1D pour Vulkan, en utilisant une boucle de regroupement bornée au lieu d'un scan K complet avec modulo. Elle retourne nullptr pour les types non pris en charge et inclut des builds pour macOS, Linux, Android, Windows et openEuler sur CPU, Vulkan, CUDA et SYCL.