ggml-cpu が Power10 MMA Q8/Q4 の K tails サポートを追加
ggml-cpu は Power10 Q8/Q4 MMA 行列乗算で K tails をサポートするようになり、K が kc で割り切れるという要件が撤廃されました。これにより、より多くのワークロードが MMA カーネルを使用可能になり、mnpack へのフォールバックが減少します。
ggml-cpu は Power10 Q8/Q4 MMA 行列乗算で K tails をサポートするようになり、K が kc で割り切れるという要件が撤廃されました。これにより、より多くのワークロードが MMA カーネルを使用可能になり、mnpack へのフォールバックが減少します。
v0.17.6 リリースでは、事前承認ツール入力ガードレールとツール出力用の SDK のみのカスタムデータが追加されました。また、ツール出力に対して厳格な JSON 互換契約を強制し、ツール名における不要な空白の警告を抑制します。@siddiksawani は今回のリリースで初となるコントリビューションを行いました。
llama.cpp バージョン b9716 は、InternVL のバッチ処理サポートを導入し、効率的なバッチ処理を通じてモデルパフォーマンスを向上させます。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリビルドが含まれており、Vulkan、OpenVINO、SYCL、ROCm を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp はバージョン b9713 をリリースし、mtmd-cli にバッチ処理サポートとビデオテストを追加しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9714 は、ストリーミングエンドポイントに "X-Accel-Buffering": "no" ヘッダーを追加し、Nginx によるレスポンスのバッファリングを防ぐことで、Pi コーディングハーネスなどのアプリケーションでのストリーミング問題を解決しました。このリリースには、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれており、複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
LLaMA.cpp バージョン b9715 は、CPU 実装に基づき GGML_OP_COL2IM_1D に対する CUDA サポートを導入しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとアクセラレーションフレームワークに対応しています。
v1.14.8a2 は、Flow 定義に単一のエージェントアクションを追加し、ロード時に CEL 式を検証します。インポート可能な運用ダッシュボードを備えた新しい Datadog 統合ガイドと、v1.14.8a1 の更新されたスナップショットおよび変更ログが含まれています。
llama.cpp が macOS、Linux、Android、Windows、openEuler 用の更新されたバイナリを含むバージョン b9711 をリリースしました。このリリースには ARM64、x64、Vulkan、ROCm、OpenVINO、SYCL、HIP のサポートが含まれており、CPU および GPU アクセラレーション用の専用バイナリが用意されています。新しい UI パッケージも利用可能です。
llama.cpp バージョン b9712 には、読み取り専用ソースファイルによって引き起こされるUIビルドの問題に対する修正が含まれています。このリリースでは、Vulkan、CUDA、OpenVINO、SYCLを含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応した、macOS、Linux、Android、Windows、openEuler用のプリビルドバイナリが提供されています。
v2.1.183 は、明示的なユーザーの同意なしに破壊的な git や destroy コマンドをブロックすることで、自動モードの安全性を向上させます。モデルに対する非推奨警告を追加し、sessionUrl を介してセッションリンクを非表示にする機能を提供します。さらに、ターミナルの動作、サブエージェントのパフォーマンス、Web および tmux 環境での入力処理を含む複数の問題を修正しました。
llama.cpp バージョンb9707は、スキーマ検証とエラーメッセージの改善を導入しました。macOS、Linux、Android、Windows、openEuler向けのバイナリビルドが含まれており、複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
LangGraphがバージョン1.2.6をリリースし、ネストされたサブグラフが親のcheckpoint_nsを誤って継承する回帰問題を修正しました。今回のアップデートでは、ストリーム中止時に実行中のサブグラフのキャンセル処理が改善され、CLIのバージョンも0.4.30に更新されました。
バージョン 1.14.8a1 は、each.do ステップにオプションの if 式を追加し、JSON crew の問題を修正しました。v1.14.8a のスナップショットと変更履歴が更新されました。貢献者には @joaomdmoura と @vinibrsl が含まれます。
llama.cpp バージョン b9703 には、サーバーのプリセット処理のリワークが含まれており、リモート HF プリセットのサポートと非推奨の関数が削除されました。このリリースでは、macOS、Linux、Android、Windows、openEuler 向けのバイナリが提供されており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9704 は、制約を黙ってドロップする代わりに、無効な構文に対して HTTP 400 を返すようになりました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、複数のアーキテクチャとハードウェアアクセラレータに対応し、Vulkan、ROCm、OpenVINO、SYCL、CUDA のサポートがあります。
llama.cpp バージョン b9702 には、ルーター引数が子インスタンスに転送されない問題の修正が含まれています。このリリースでは、Vulkan、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーション オプションに対応した、macOS、Linux、Android、Windows、openEuler 用のバイナリが提供されています。
llama.cpp バージョン b9701 は、mtmd_image_preproc_out 機能と更新された開発者ドキュメントを備えた再構成されたプリプロセッサを導入しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9700 は、API フラグの名前変更を含む更新された SYCL サポートを導入しました:GGML_SYCL_SUPPORT_LEVEL_ZERO が GGML_SYCL_SUPPORT_LEVEL_ZERO_API に、GGML_SYCL_ENABLE_LEVEL_ZERO が GGML_SYCL_USE_LEVEL_ZERO_API に名前変更されました。このリリースには、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれており、Vulkan、ROCm、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
LLaMA.cpp バージョン b9698 は、llama-install.sh でビルドされた場合のみ自己更新を有効にします。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp version b9699 introduces support for MUL_MAT and OUT_PROD operations with Q1_0 precision via PR #24721. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and acceleration frameworks, including SYCL (FP32 and FP16), Vulkan, CUDA, ROCm, and OpenVINO.