すべての記事 — korshunov.ai

すべての記事ページ 1 / 10

llama.cpp b9832 リリースで --dump-prog デバッグフラグが追加

llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。

github llama.cpp · 3日前

llama.cpp b9831 リリースで DFlash サポートと新しいバイナリが追加

llama.cpp の b9831 リリースでは、レイヤータイプごとのスライディングウィンドウアテンションを含む DFlash v2 サポートが導入され、複数のプラットフォーム向けの包括的なビルド済みバイナリセットも提供されています。

github llama.cpp · 3日前

llama.cpp b9830 リリースで --offline フラグが追加され、メモリバグが修正される

llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。

github llama.cpp · 4日前

llama.cpp b9829 リリース: ログの削減とマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9829 をリリースしました。これには、サーバー、共通コンポーネント、推測的デコーディングモジュールでのログ出力の削減が含まれます。このアップデートでは、CMN_ から COM_ への置換により命名規則が標準化されました。

github llama.cpp · 4日前

llama.cpp b9828 リリース: OpenCL Flash Attention の改善と新しいバイナリ

llama.cpp b9828 リリースは、f16 および f32 精度の Flash Attention カーネルを再構築するなど、OpenCL の大幅な強化をもたらしました。このアップデートには、新しいプレフィルプリパスカーネルと q4_0 および q8_0 量子化形式のサポートが含まれます。

github llama.cpp · 4日前

llama.cpp b9827 リリースで CUDA 2D 非同期コピーの最適化が追加

llama.cpp b9827 リリースは、ggml_cuda_cpy 関数に cudaMemcpy2DAsync の高速パスを追加することで、CUDA のパフォーマンス最適化を導入します。この変更により、テンソルが完全に連続していないものの各行が連続している場合の、同じ型・同じ形状のストライド付きコピーを高速化し、従来の要素ごとのスカラーコピーカーネルに代わります。

github llama.cpp · 4日前

llama.cpp b9825 リリース: Vulkan 修正とクロスプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9825 をリリースしました。このバージョンには、ゼロ入力を処理する際の Vulkan ステップ演算子の修正が含まれています。このアップデートにより、macOS、Linux、Windows、Android、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリが提供されます。

github llama.cpp · 4日前

SYCLのノーマライゼーション修正を含むllama.cpp b9826リリース

llama.cppプロジェクトは、SYCLにおけるノーマライゼーション関数に関連するユニットテストケースの失敗を修正したb9826リリースを発表しました。このアップデートでは、複数のプラットフォームとハードウェアアクセラレータにわたってビルド済みバイナリとフレームワークが提供されます。

github llama.cpp · 4日前

macOS、Linux、Windowsのバイナリを含むllama.cpp b9822リリース

llama.cppプロジェクトはb9822リリースを公開し、macOS、iOS、Linux、Android、Windows向けのビルド済みバイナリを提供しました。このアップデートには、test-chat-template --no-commonオプションの修正が含まれ、さまざまなハードウェアアーキテクチャとアクセラレータ向けにビルドが配布されています。

github llama.cpp · 4日前

llama.cpp b9823 リリースで Windows OpenVINO が追加され、バイナリが更新される

llama.cpp プロジェクトはバージョン b9823 を公開し、macOS、iOS、Linux、Android、Windows、openEuler プラットフォーム向けのビルド済みバイナリを提供しています。このリリースの主な変更点は、check-release パイプラインに Windows 用の OpenVINO ビルドが追加されたことです。

github llama.cpp · 4日前

llama.cpp b9824 リリース: バイナリ名の変更と新しいビルド

llama.cpp プロジェクトはバージョン b9824 をリリースしました。これには、rpc-server および export-graph-ops のバイナリに対する改善が含まれます。

github vLLM · 5日前

v0.24.0

v0.24.0 リリースには、MoE リファクタリングの Qwen3 NVFP4 構成に対する GSM8K の起動タイムアウトを引き上げるための継続的インテグレーションの更新が含まれています。

lab OpenAI News · 5日前

OpenAIがGPT-5.6 Sol、Terra、Lunaモデルをプレビュー

OpenAIはGPT-5.6シリーズの限定プレビューを開始し、フラッグシップのSol、バランスの取れた日常業務用のTerra、高速で低コストなタスク用のLunaという3つの新モデルを導入した。同社は、信頼できるパートナーとの初期フェーズを経て、数週間以内にこれらのモデルを一般公開する計画である。

github llama.cpp · 5日前

llama.cpp b9821 リリース: CLI フラグとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9821 をリリースしました。このバージョンでは、--version、--licenses、--help フラグを呼び出すことができるコマンドラインインターフェースの更新が導入されました。本リリースでは、macOS、Linux、Android、Windows、openEuler 向けに、さまざまなハードウェアアクセラレータに対応した包括的なプリビルドバイナリセットが提供されます。

lab Claude Code Releases · 5日前

Claude Code v2.1.195 リリースノート

Claude Code バージョン 2.1.195 は、いくつかの修正と改善をもたらします。これには、全画面モードでのマウス操作用の新しい環境変数や、フックマッチャーロジックの修正が含まれます。

github llama.cpp · 5日前

llama.cpp b9820 リリース: CUDA の同期を削減し、新しいバイナリを追加

llama.cpp b9820 リリースは、分割計算中に同期回数を減らすことでパフォーマンスを改善しました。特に CUDA バックエンドを対象としています。このアップデートでは、CPU、GPU、および特殊なハードウェアアクセラレータ向けに、macOS、Linux、Windows、Android、openEuler 用のビルド済みバイナリも提供されます。

github llama.cpp · 5日前

llama.cpp b9816 リリース: ggml との同期および新しいバイナリ

llama.cpp プロジェクトは、ggml ライブラリとの同期を含むバージョン b9816 をリリースしました。このアップデートでは、macOS、iOS、Linux、Windows、Android、openEuler のプラットフォーム向けにビルド済みバイナリが提供されます。

github llama.cpp · 5日前

llama.cpp b9817 リリース: OpenVINO 2026.2.1 の更新と演算子の改善

llama.cpp b9817 リリースでは、OpenVINO バックエンドがバージョン 2026.2.1 に更新され、リリースパッケージが自己完結型になりました。このアップデートには、OpenVINO バックエンド内のいくつかの演算子改善が含まれています。具体的には、ハードコードされた compute_op_type のセットの削除や、sink 入力に対応する softmax の有効化などです。

github llama.cpp · 5日前

llama.cpp b9813 リリースで Intel Xe-LPG Plus の Vulkan サポートが追加

llama.cpp b9813 リリースは、INTEL_XE1 アーキテクチャ列挙型の追加と coopmat1 の有効化により、Intel Xe-LPG Plus ハードウェアに対する Vulkan サポートを導入します。この更新では、以前のコードコメントへの対応、アーキテクチャ識別子の名前変更、および Windows ドライバーのチェックが含まれています。

github llama.cpp · 5日前

llama.cpp b9814 リリース、mi50 向け Vulkan 最適化

llama.cpp プロジェクトはバージョン b9814 をリリースしました。このバージョンには、AMD mi50 GPU に特化した Vulkan における `mul_mat_vecq` 演算の最適化が含まれています。このアップデートには、複数のオペレーティングシステムとハードウェアアーキテクチャにわたる包括的なプリビルドバイナリセットも同梱されています。