Tous les articles — korshunov.ai

Tous les articles Page 1 / 14

Branche de release créée pour v1.38.0

Une branche de release a été créée pour la version 1.38.0. Cela marque le début du processus de release pour la mise à jour.

github llama.cpp · il y a 16 j

llama.cpp publie b96669 avec échantillonnage backend pour Eagle3

La version b96669 de llama.cpp ajoute le support de l'échantillonnage backend pour Eagle3. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

llama.cpp Release b9670 : Corrections et nouvelles versions

La version llama.cpp b9670 inclut des corrections pour les cas limites NVFP4 dans llama-graph, notamment le déplacement des opérations MUL post-GEMM et la restriction de build_ffn aux combinaisons prises en charge. La version fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options de backend, y compris CUDA, Vulkan, SYCL et OpenVINO.

github llama.cpp · il y a 16 j

llama.cpp Release b9667 Ajoute le Support de Vulkan et CUDA

La version b9667 de llama.cpp introduit le support de Vulkan avec S_v=16 via gated_delta_net. Elle inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options pour Vulkan, CUDA 12.4 et 13.3, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

llama.cpp release b9668 ajoute la mémoire visible hôte UMA et des binaires multiplateformes

La version b9668 de llama.cpp implémente des tampons de mémoire visible hôte UMA pour de meilleures performances sur les appareils UMA, sur la suggestion de 0cc4m. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec un package UI dédié.

github llama.cpp · il y a 16 j

llama.cpp release b9665 ajoute le drapeau --offline et de nouveaux binaires

La version b9665 de llama.cpp introduit un nouveau drapeau --offline pour le benchmarking. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

LLaMA.cpp Release b9663 Ajoute le Support SYCL et de Nouveaux Binaires

La version b9663 de LLaMA.cpp ajoute la prise en charge de OP EXPM1 et tous les cas de test unitaires pour FLOOR, TRUNC et ROUND. Elle inclut des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler, avec le support de SYCL (FP32 et FP16), Vulkan, CUDA 12.4 et 13.3, ainsi que ROCm 7.2, accompagnée d'une interface utilisateur mise à jour.

github llama.cpp · il y a 16 j

sycl : prise en charge des MUL_MAT_ID MoE Q4_K/Q5_K/Q6_K réordonnés

La mise à jour sycl étend la prise en charge de la gestion des tenseurs d'experts réordonnés dans MoE MUL_MAT_ID à Q4_K, Q5_K et Q6_K. Les cas de réorganisation 3D non pris en charge basculent maintenant vers un fallback au lieu de provoquer un abort.

github llama.cpp · il y a 16 j

Vulkan ajoute l'op col2im_1d et prend en charge plusieurs plateformes

La version b9661 de llama.cpp ajoute le support GGML_OP_COL2IM_1D pour Vulkan, en utilisant une boucle de regroupement bornée au lieu d'un scan K complet avec modulo. Elle retourne nullptr pour les types non pris en charge et inclut des builds pour macOS, Linux, Android, Windows et openEuler sur CPU, Vulkan, CUDA et SYCL.