すべての記事
github llama.cpp · 5日前

llama.cpp b9804 リリース: Mamba2 の修正と新しいバイナリ

llama.cpp b9804 リリースは、Mamba2 アーキテクチャの修正を導入しました。これは、ハードコードされた 2 倍の展開係数と無効なパラメータチェックを削除し、任意の展開値をサポート可能にします。この変更により、`convert_hf_to_gguf.py` スクリプトが更新され、展開パラメータがデフォルト値 2 でオプションとなりました。

github llama.cpp · 6日前

OpenCLプロファイリング修正を含むllama.cpp b9803リリース

llama.cppプロジェクトは、不完全なバッチのシャットダウン時にプロファイリングバッチをフラッシュするOpenCLの修正を含むバージョンb9803をリリースしました。このアップデートにより、macOS、Linux、Windows、Android、openEuler向けに、さまざまなハードウェアバックエンド用のバイナリが提供されます。

github llama.cpp · 6日前

llama.cpp b9802 リリースで macOS、Linux、Windows、Android のバイナリが提供される

llama.cpp プロジェクトは、複数のオペレーティングシステムとハードウェアアーキテクチャにわたってビルド済みバイナリを提供する b9802 リリースを公開しました。このアップデートには、macOS、Linux、Windows、Android、openEuler などのプラットフォームにおける CPU、GPU、および専用 AI アクセラレータのサポートが含まれています。

lab Cohere Blog · 6日前

AIエージェントによるフォークメンテナンスの自動化

本記事では、AIコーディングエージェントを使用してソフトウェアフォークのメンテナンスを自動化する方法について説明し、vLLMのCohereによるフォークに適用しています。このアプローチは、手動介入を自動フィードバックループに置き換えることで、上流からのリリースを取り込むのに必要な時間を数週間から数日に圧縮します。

lab Microsoft Research Blog · 6日前

AI駆動の説明と実験による脳の理解

研究者らは、解釈不可能なLLMベースの脳予測モデルを、皮質機能に関する簡潔で検証可能な言語仮説に変換するフレームワークである生成因果テスト(GCT)を開発した。この手法は、モデルのパラメータを「食品の準備」など特定の脳領域が何に反応するかを記述する短いフレーズに凝縮し、その後、標的型fMRI実験を通じてこれらの説明を検証する。

lab Cohere Blog · 6日前

CohereがカスタムMCPサーバー経由でNorthとWizを活用しインシデント対応を自動化

Cohereは、エンタープライズAIプラットフォーム「Cohere North」を用いてセキュリティエージェントを開発し、カスタムModel Context Protocol (MCP)サーバーを通じてクラウドセキュリティプラットフォームのWizと統合しました。このアーキテクチャでは、8つの原子型ツールを介してNorthからWizのGraphQL APIへ接続し、単一のプロンプトからインシデント対応ワークフローを自動化します。本システムは、攻撃チェーンを評価し、インターネットへの公開度合いや権限レベルに基づいてリスクをランク付けすることで、毒性のある組み合わせによる被害範囲(blast radius)分析を約20秒で実行します。さらに、問題の詳細取得、Linearチケットの作成、Wizステータスの更新、構造化されたインシデント対応レポートのドラフト作成により、エンドツーエンドの調査プロセスも自動化しています。加えて、毎週月曜朝に手動介入なしでセキュリティ姿勢(security posture)のブリーフを生成する定期的な自動化機能も備えています。この統合により、各発見事項に対して以前必要だった30分〜2時間のトリアージループが解消され、エンジニアは生のアラートではなく評価内容の評価に集中できるようになります。

github llama.cpp · 6日前

llama.cpp b9788がデュアルGPU環境向けにSYCLテンソル並列化を追加

llama.cppのリリースb9788は、SYCLバックエンドにおいて--split-mode tensorフラグ経由でテンソル並列化のサポートを導入しました。この実装は、meta-backendにcomm_init、comm_free、およびcomm_allreduce_tensor関数を追加することで、デュアルGPU間の通信を可能にします。2つのデバイスでは、小さなテンソルにはFP32の直接memcpyを、大きなテンソルにはBF16圧縮を使用するリングアールリデューズ戦略を採用しています。本コードは、プロセスあたりのシングルデバイスという制限があるOneCCLを回避し、代わりに永続バッファを使用してSYCLプールの不変条件を維持します。デュアルIntel Arc Pro B70 GPUでのパフォーマンステストでは、Llama-3.3-70BおよびQwen3-Coder-Next-80B-A3Bモデルにおいてレイヤーモードと比較して大幅な高速化が確認されました。本アップデートには、CPU、CUDA、ROCm、Vulkan、SYCLの各ターゲット向けに、macOS、Linux、Windows、Android、openEuler用の新しいバイナリが含まれています。

github llama.cpp · 6日前

llama.cpp b9789 リリースは MoE 量子化を修正し、マルチプラットフォームバイナリを提供

llama.cpp プロジェクトは、マルチトークン予測を用いた Mixture of Experts (MoE) モデルの量子化に関する重要な修正を含むバージョン b9789 をリリースしました。このアップデートは、これらの特定のモデルアーキテクチャを適切に処理するために、プルリクエスト #24986 で特定された問題を解決します。本リリースでは、macOS 向け Apple Silicon および Intel の事前ビルド済みバイナリ、および iOS 向け XCFramework が提供されます。Linux ユーザーは、CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL バックエンド向けの Ubuntu ビルドをダウンロードできます。Windows サポートには、CPU、CUDA 12.4 および 13.3、Vulkan、OpenVINO、SYCL、HIP の各バリアントが含まれます。Android arm64 や openEuler などの追加プラットフォームも、特定のハードウェア構成でサポートされています。

lab OpenAI News · 6日前

OpenAIの研究、AIエージェントが仕事を変革していることを示す

OpenAIからの新しい研究論文は、人工知能エージェントが仕事の性質を根本的にどのように変えているかを示しています。この研究は、これらのエージェントが以前よりも長く、より複雑なタスクを実行する能力に焦点を当てています。この技術的進歩は、幅広い職業役割全体で生産性を拡大したと評価されています。調査結果は、自動化を通じて労働の組織化と実行方法に大きな変化が生じることを示唆しています。AIエージェントが複雑なワークフローを処理することで、ユーザーはより高い効率を達成できるようになっています。論文は、自律型システムが現代の雇用にもたらす影響が増大していることの証拠となっています。

github llama.cpp · 7日前

SYCLにおけるconv_3dの失敗したユニットテストケースを修正

llama.cppリポジトリは、SYCLバックエンドに関する特定の問題に対処しました。conv_3d演算に関連する失敗したユニットテストケースを修正するためのプルリクエストが提出されました。この更新はGitHub上のggml-org/llama.cppプロジェクトを対象としています。この変更により、以前にこれらのテストの正常な実行を妨げていたエラーが解消されました。この修正により、SYCLベースのハードウェアアクセラレーションを利用するユーザーにとっての安定性が向上します。

github llama.cpp · 7日前

llama.cpp b9786 リリースで OpenCL の非連続行サポートが追加

llama.cpp プロジェクトはバージョン b9786 をリリースし、OpenCL による正規化での非連続行のサポートを導入しました。このアップデートは、ggml-org チームによるハードウェア互換性と各種プラットフォームでのパフォーマンス向上に向けた継続的な開発の一環です。本リリースでは、macOS Apple Silicon、Intel Mac、および iOS XCFrameworks のバイナリが提供されます。Linux ユーザーは、CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL のバックエンドを使用して、Ubuntu x64、arm64、s390x アーキテクチャのビルドにアクセスできます。Android では arm64 CPU デバイスのサポートが利用可能で、Windows では CPU、CUDA 12 および 13、Vulkan、OpenVINO、SYCL、HIP を含む広範なオプションが提供されます。また、本リリースでは macOS と openEuler プラットフォームにおける KleidiAI のビルドが無効化されていることも記載されています。

github llama.cpp · 7日前

llama.cpp b9785 リリース: ハードニングされたキャップチェックとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9785 をリリースしました。これは、プルリクエスト #24973 で詳述されているように、キャップチェックを強化するコード変更が含まれています。このアップデートでは、macOS Apple Silicon、Intel Mac、および XCFramework 経由の iOS 向けにプリビルドバイナリが提供され、Apple Silicon 上では KleidiAI サポートが無効になっています。Ubuntu を含む Linux ディストリビューションは、x64、arm64、s390x アーキテクチャ全体で CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL バックエンドをサポートしています。Android ユーザーは arm64 CPU バイナリにアクセスでき、Windows では CPU、OpenCL Adreno、CUDA 12 および 13、Vulkan、OpenVINO、SYCL、HIP を網羅する広範なオプションが提供されます。本リリースには、ACL Graph サポートを備えた x86 と aarch64 プロセッサを対象とした openEuler 向けビルドも含まれています。プラットフォーム固有のリリースとは別に、ローカルモデル推論を容易にするスタンドアロン UI パッケージも利用可能です。

lab Claude Code Releases · 7日前

Claude Code v2.1.191 リリースノート

Claude Code バージョン 2.1.191 は、/clear コマンドが実行される前の会話から再開できるようにする /rewind サポートを導入しました。このアップデートは、停止されたバックグラウンドエージェントが復活したり、ストリーミング応答中にスクロール位置がジャンプしたりするなどの深刻な問題のいくつかを修正します。また、/voice が汎用的なエラーメッセージを表示したり、Windows Terminal で /login URL が切り捨てられたりする動作も修正されました。MCP サーバーの信頼性を大幅に向上させるため、機能検出と OAuth フロー中に一時的なネットワークエラーが発生した場合のリトライロジックが追加されました。ヘッドレス環境では、OAuth のブラウザポップアップがスキップされ、サンドボックスのネットワーク権限はセッション期間中記憶されます。パフォーマンスの最適化により、テキスト更新の結合を通じてストリーミング中の CPU 使用率が約 37% 削減され、ターミナル出力キャッシュによる長時間セッションでのメモリ増加も緩和されました。