Asahi Linux向けVulkan行列積最適化を含むllama.cpp b9846リリース
llama.cppプロジェクトは、Asahi Linux向けのVulkanバックエンド最適化を含むバージョンb9846をリリースしました。このアップデートでは、Apple Siliconハードウェア上でLinuxを実行する環境における互換性とパフォーマンスを向上させるため、行列積のブロックサイズループをロールバックしています。
llama.cppプロジェクトは、Asahi Linux向けのVulkanバックエンド最適化を含むバージョンb9846をリリースしました。このアップデートでは、Apple Siliconハードウェア上でLinuxを実行する環境における互換性とパフォーマンスを向上させるため、行列積のブロックサイズループをロールバックしています。
llama.cpp プロジェクトはバージョン b9844 をリリースし、NVFP4 量子化形式に対する ggml-webgpu のサポートを導入しました。このアップデートでは、macOS、iOS、Linux、Android、Windows、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリも提供されています。
Google UKは、国内でより多くの人々がAI搭載技術の恩恵を引き出すための戦略を詳述した最新の経済影響レポートを発表しました。
llama.cppプロジェクトは、b9843リリースを公開しました。これにより、macOS、Linux、Android、Windows、openEulerの各プラットフォーム向けに、さまざまなハードウェアアーキテクチャに対応したビルド済みバイナリが提供されます。
LangGraph バージョン 1.2.7 がリリースされ、LangChain エコシステム向けのバグ修正と依存関係の更新が導入されました。
Microsoft Researchは、長期のAIタスクにおいて抽象化と具体性のバランスを取るために設計されたスケーラブルなエージェント型メモリフレームワークであるMemoraを発表しました。このシステムは、豊富なメモリコンテンツを軽量な検索構造から分離し、ベンチマークで新たな最先端の結果を達成しながら、コンテキストトークンを最大98%削減します。
Claude Code バージョン 2.1.196 は、組織デフォルトモデル、クリック可能なファイル添付、MCP サーバー承認のセキュリティ強化を導入します。このアップデートは、バックグラウンドセッションの信頼性を向上させ、さまざまなエージェントステータスレポートの問題を修正し、コードレビューワークフローでのトークン使用量を最適化します。
Googleの専門家が、人工知能におけるフルスタックアプローチの概念を解説する。 本記事は、この包括的な手法がGoogleのAI研究の基盤として長年にわたり機能してきたことを強調している。
llama.cpp b9842 リリースでは、/v1/models エンドポイントにおけるプリセットおよびキャッシュ済みモデルエントリの重複排除に関する変更が導入されました。このアップデートは、Hugging Face の Adrien Gallouët によって承認されています。
研究者らは、外科的インプラントなしで磁気脳波(MEG)記録からリアルタイムの文章を解読する非侵襲型AIパイプラインであるBrain2Qwerty v2を公開した。このシステムは全体として61%の単語精度を達成し、上位層では78%に達し、以前の非侵襲的手法を大幅に上回っている。
llama.cpp b9840 リリースは、Pro バリアントの特定の処理を含む DeepSeek V4 モデルの変換サポートを導入しました。このアップデートでは、新しいアーキテクチャをライブラリに統合し、各種内部最適化とバグ修正を行いました。
OpenAI Economic Researchは、ESCO分類とEurostatデータを活用し、AIの能力が加盟国全体の労働市場をどのように再構築するかを分析するために、AI雇用移行フレームワークを欧州連合に拡張しました。
llama.cppプロジェクトは、無視されたワークツリーでTailwindスキャンを復元する修正を含むバージョンb9839をリリースしました。このアップデートでは、macOS、Linux、Android、Windows、openEuler向けのプリビルドバイナリが、さまざまなアーキテクチャとハードウェアアクセラレーションバックエンドで提供されています。
llama.cpp プロジェクトはバージョン b9838 をリリースし、幅広いオペレーティングシステムとハードウェアアクセラレータ向けのプリビルドバイナリを提供しました。このリリースでは、macOS、Linux、Windows、Android、openEuler 上で、CPU、GPU(CUDA、Vulkan、ROCm、OpenCL)、および専用 AI アクセラレータのサポートが含まれています。
HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。
llama.cppプロジェクトは、シングルモデルモードでの停止および推論スキップ機能の修正を含むバージョンb9835をリリースしました。このアップデートは、モデル推論中の制御を改善するためにユーザーインターフェース内の特定の問題に対処しています。
llama.cpp プロジェクトはバージョン b9833 をリリースし、MiniCPM5 モデル専用のパーサーをはじめとする各種バグ修正とリファクタリングを導入しました。このアップデートには、ツール呼び出しのパーシング対応、文法の簡略化、Jinja2 基準との互換性を確保するための Jinja API の動作修正が含まれます。
llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。
llama.cpp の b9831 リリースでは、レイヤータイプごとのスライディングウィンドウ アテンションを含む DFlash v2 サポートが導入され、複数のプラットフォーム向けの包括的なビルド済みバイナリセットも提供されています。
llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。