GLM-5.2 DSAインデクサーの修正:テンソルが不要としてマークされる
GLM-5.2モデルのDSAインデクサーはすべてのレイヤーに誤って読み込まれており、欠落したテンソルにより失敗していました。今回の更新では、インデクサーのテンソルをTENSOR_NOT_REQUIREDとしてマークし、インデクサーのないレイヤーがnullptrとして読み込まれるようにし、MLAアテンションを完全に有効にします。均一なインデックス付けを持つDeepSeek-V3.2は影響を受けません。
GLM-5.2モデルのDSAインデクサーはすべてのレイヤーに誤って読み込まれており、欠落したテンソルにより失敗していました。今回の更新では、インデクサーのテンソルをTENSOR_NOT_REQUIREDとしてマークし、インデクサーのないレイヤーがnullptrとして読み込まれるようにし、MLAアテンションを完全に有効にします。均一なインデックス付けを持つDeepSeek-V3.2は影響を受けません。
Dockerのs390xアーキテクチャ向けにプリビルドされたWeb UIを追加するプルリクエストが提出されました。この変更は現在リリース待ちであり、まだ公開されていません。
Rust バージョン 0.0.15 がリリースされました。この初期バージョンは Rust の初期開発フェーズの一部であり、言語の基盤となる機能を含んでいます。
Open Interpreter がバージョン 0.0.16 をリリースしました。このアップデートは、コア機能に新機能と改善を導入し、ユーザーインタラクションとタスク実行能力を強化します。
Open Interpreter がバージョン 0.0.17 をリリースしました。このアップデートでは、コア機能に新機能と改善が導入され、ユーザーインタラクションとタスク実行能力が強化されました。
LLaMA.cpp は、macOS、Linux、Android、Windows、openEuler 用の更新されたバイナリを含むバージョン b9732 をリリースしました。今回のリリースには、子からルーターへの通信のリファクタリング、ウェイクアップ処理の修正、改善された update_status()、およびドキュメントが含まれています。新しいビルドは、Vulkan、ROCm、OpenVINO、SYCL、および複数のアーキテクチャ上の CUDA 12/13 をサポートしています。
ggml-webgpu プロジェクトは、Vulkan および NVIDIA GPU のハーフ精度 (F16) サポート用アダプター トグルを追加しました。このアップデートにより、macOS、Linux、Android、Windows、openEuler を含む複数のプラットフォームで互換性のあるハードウェアのパフォーマンスが向上し、ARM および x64 アーキテクチャ用の特定のビルドも提供されています。
llama.cpp バージョン b9731 は、トークンソートオーバーヘッドを削減するために std::partial_sort を使用した最適化を導入し、top-n トークン選択のパフォーマンスを 8.555ms から 0.704ms に改善しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリビルドバイナリが含まれており、複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9730 には、Windows での UTF-8 処理の修正と ggml_fopen および CLI の改善が含まれています。このリリースでは、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応した、macOS、Linux、Android、Windows、openEuler 用のバイナリが提供されます。
Rust バージョン 0.0.12 がリリースされました。この初期バージョンは Rust の初期開発フェーズの一部であり、言語の基盤となる機能を含んでいます。
Rust バージョン 0.0.13 がリリースされました。この初期バージョンは Rust の初期開発フェーズの一部であり、言語の基盤となる機能を含んでいます。
Rust バージョン 0.0.14 がリリースされました。この初期バージョンは Rust の初期開発フェーズの一部であり、言語の基盤となる機能を含んでいます。
LLaMA.cpp は、macOS、Linux、Android、Windows、openEuler 向けのバイナリを複数のアーキテクチャでリリースしました。今回のリリースには、CPU、Vulkan、OpenVINO、SYCL、ROCm のサポートが含まれ、新しい UI パッケージも追加されました。内部の 'webui' への参照は削除されました。
LLaMA.cpp バージョン b9728 は、--api-key-file 設定でコメント行のサポートを導入しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリビルドバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9726 は、新しい --agent 引数を導入し、冗長な webui 命名の互換性を削除しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリコンパイル済みバイナリが含まれており、複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
llama.cpp バージョン b9727 は cpp-httplib をバージョン 0.48.0 に更新します。このリリースには、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。
DockerプロジェクトはUIコンポーネントのビルドサポートを追加しました。このアップデートには、コンテナ設定で既存のAPP_VERSIONを使用することも含まれています。
llama.cpp バージョン b9724 には、ビルドの修正、area() 関数でのオーバーフロー回避、get_u32() 内の健全性チェックなど、いくつかのバグ修正と改善が含まれています。このリリースでは、macOS (arm64 および x64)、Linux (x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL)、Android (arm64)、Windows (x64、arm64、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)、openEuler (ACL Graph サポート付きの x86 および aarch64) 用のビルド済みバイナリと UI パッケージが提供されます。
llama.cpp バージョン b9723 は、Eagle3 を介して Qwen3.5 および Qwen3.6 モデルのサポートを導入しました。今回のリリースには、ハイブリッドモデル用の遅延境界チェックポイント復元、および API および命名規則の更新が含まれています。macOS、Linux、Android、Windows、openEuler プラットフォーム向けにバイナリビルドが利用可能で、CPU、Vulkan、OpenVINO、SYCL、ROCm のオプションがあります。
LLaMA.cpp バージョン b9722 は、サーバーコンテキスト処理における n_discard 値の非バインド問題を修正しました。このリリースには、macOS、Linux、Android、Windows、openEuler 用のプリコンパイル済みバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL などの各種アーキテクチャとアクセラレーションフレームワークをサポートしています。