LLaMA.cpp リリース b9678 に最適化とクロスプラットフォームビルドが追加
LLaMA.cpp リリース b9678 には、decode 用の mul_mat_f16_f32_l4 の最適化が含まれ、macOS、Linux、Android、Windows、openEuler 向けの新しいビルドが導入されました。このリリースでは、複数のアーキテクチャで CPU、Vulkan、ROCm、OpenVINO、SYCL、HIP のサポートを提供し、専用の UI パッケージも利用可能です。
LLaMA.cpp リリース b9678 には、decode 用の mul_mat_f16_f32_l4 の最適化が含まれ、macOS、Linux、Android、Windows、openEuler 向けの新しいビルドが導入されました。このリリースでは、複数のアーキテクチャで CPU、Vulkan、ROCm、OpenVINO、SYCL、HIP のサポートを提供し、専用の UI パッケージも利用可能です。
LLaMA.cpp のバージョン b9674 は、MoE プリフェッチ中の SYCL の非同期 memcpy における use-after-free バグを修正しました。このリリースには、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれており、複数のアーキテクチャ上で CPU、Vulkan、ROCm、OpenVINO、SYCL、CUDA をサポートしています。
llama.cpp バージョン b9675 は、SQR、SQRT、LOG、SIN、COS、CLAMP などの操作に対して FP16 サポートを有効にしました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、複数のアーキテクチャに対応し、Vulkan、ROCm、OpenVINO、SYCL(FP16 および FP32)、CUDA 12.4 および 13.3 をサポートしています。
llama.cpp は、macOS、Linux、Android、Windows、openEuler 向けの更新された Vulkan サポートと新しいバイナリを含むバージョン b9680 をリリースしました。このリリースには、Vulkan、CUDA、OpenVINO、SYCL、ROCm をサポートする複数のアーキテクチャ用の CPU および GPU バリアントが含まれています。
llama.cpp バージョン b9673 では、≥1GB の GPU バッファーに対するオプションの USM システム割り当てが導入され、デバイスサポートが利用可能な場合に VRAM オーバーコミットを有効にします。この機能には GGML_SYCL_USM_SYSTEM 環境変数が必要で、デフォルトでは無効になっており、サポートされていない場合は通常の割り当てにフォールバックします。
v2.1.179 は、接続の中途切断、WSL2 でのマウスホイールスクロールの問題、および過度な Bash ツールの説明を引き起こすサンドボックスのグロブバグを修正します。また、フィードバックアンケートのエラー、プロモーションバナーの重複表示、サブエージェントビューのフォーカス問題を解決し、リモートセッションでのプラグイン読み込みを改善しました。
llama.cpp がバージョン b9660 をリリースし、LFM2 ツール呼び出し解析の二重エスケープ問題を修正しました。今回のアップデートには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。また、専用 UI パッケージも提供されています。
langgraph-cli バージョン 0.4.30 がリリースされました。互換性のあるAPIバージョン範囲のサポートが追加されています。 また、ドキュメントの一貫性を向上させるために、標準化されたREADME.md構造が含まれています。
Claude v2.1.178 は、Tool(param:value) 構文を使用した新しい権限ルール、ネストされたディレクトリでのワークフローとスキルの読み込みの改善、および自動モードとエラーメッセージングの強化を導入します。クラッシュ、認証エラー、Chrome および VSCode での UI の動作など、重要な問題に対処し、ツールプロンプトと元に戻す機能を洗練させました。
llama.cpp はバージョン b9672 をリリースし、BoringSSL を 0.20260616.0 に更新しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
バージョン 1.38.0 のためのリリースブランチが作成されました。これは更新のリリースプロセスの開始を示しています。
llama.cpp バージョン b9669 は、Eagle3 のバックエンドサンプリングサポートを追加しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp release b9670 には、llama-graph における NVFP4 のエッジケースの修正が含まれています。これには、GEMM 後の MUL 操作の移動や、build_ffn をサポートされている組み合わせに制限することが含まれます。このリリースでは、macOS、Linux、Android、Windows、openEuler 向けのバイナリが提供されており、CUDA、Vulkan、SYCL、OpenVINO を含む複数のアーキテクチャとバックエンドオプションに対応しています。
llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.
llama.cpp バージョン b9668 は、0cc4m の提案に基づき、UMA デバイスでのパフォーマンス向上のために UMA ホスト可視メモリバッファを実装しました。このリリースには、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれており、CPU、Vulkan、ROCm、OpenVINO、SYCL、HIP をサポートし、専用 UI パッケージも提供されています。
llama.cpp バージョン b9665 は、ベンチマーク用の新しい --offline フラグを導入しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリビルドが含まれており、Vulkan、CUDA、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
LLaMA.cpp の b9663 リリースでは、OP EXPM1 のサポートと FLOOR、TRUNC、ROUND のすべてのユニットテストケースが追加されました。macOS、Linux、Android、Windows、openEuler 用の更新されたバイナリが含まれており、SYCL(FP32 および FP16)、Vulkan、CUDA 12.4 および 13.3、ROCm 7.2 のサポートに加え、UI も更新されています。
sycl の更新により、MoE MUL_MAT_ID における再順序付けされたエキスパートテンサーの処理が Q4_K、Q5_K、および Q6_K に拡張されました。サポートされていない 3D 再順序付けケースは、中止するのではなくフォールバックに切り替わるようになりました。
llama.cppのリリースb9661は、Vulkan向けにGGML_OP_COL2IM_1Dサポートを追加しました。これは、モジュロ付きのフルKスキャンの代わりに有界なgatherループを使用します。サポートされていない型にはnullptrを返し、CPU、Vulkan、CUDA、SYCLに対応するmacOS、Linux、Android、Windows、openEulerのビルドを含みます。