すべての記事
github llama.cpp · 4日前

llama.cpp b9827 リリースで CUDA 2D 非同期コピーの最適化が追加

llama.cpp b9827 リリースは、ggml_cuda_cpy 関数に cudaMemcpy2DAsync の高速パスを追加することで、CUDA のパフォーマンス最適化を導入します。この変更により、テンソルが完全に連続していないものの各行が連続している場合の、同じ型・同じ形状のストライド付きコピーを高速化し、従来の要素ごとのスカラーコピーカーネルに代わります。

github llama.cpp · 4日前

llama.cpp b9825 リリース: Vulkan 修正とクロスプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9825 をリリースしました。このバージョンには、ゼロ入力を処理する際の Vulkan ステップ演算子の修正が含まれています。このアップデートにより、macOS、Linux、Windows、Android、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリが提供されます。

github llama.cpp · 4日前

SYCLのノーマライゼーション修正を含むllama.cpp b9826リリース

llama.cppプロジェクトは、SYCLにおけるノーマライゼーション関数に関連するユニットテストケースの失敗を修正したb9826リリースを発表しました。このアップデートでは、複数のプラットフォームとハードウェアアクセラレータにわたってビルド済みバイナリとフレームワークが提供されます。

lab Cohere Blog · 6日前

AIエージェントによるフォークメンテナンスの自動化

本記事では、AIコーディングエージェントを使用してソフトウェアフォークのメンテナンスを自動化する方法について説明し、vLLMのCohereによるフォークに適用しています。このアプローチは、手動介入を自動フィードバックループに置き換えることで、上流からのリリースを取り込むのに必要な時間を数週間から数日に圧縮します。

lab Microsoft Research Blog · 6日前

AI駆動の説明と実験による脳の理解

研究者らは、解釈不可能なLLMベースの脳予測モデルを、皮質機能に関する簡潔で検証可能な言語仮説に変換するフレームワークである生成因果テスト(GCT)を開発した。この手法は、モデルのパラメータを「食品の準備」など特定の脳領域が何に反応するかを記述する短いフレーズに凝縮し、その後、標的型fMRI実験を通じてこれらの説明を検証する。

lab Cohere Blog · 6日前

CohereがカスタムMCPサーバー経由でNorthとWizを活用しインシデント対応を自動化

Cohereは、エンタープライズAIプラットフォーム「Cohere North」を用いてセキュリティエージェントを開発し、カスタムModel Context Protocol (MCP)サーバーを通じてクラウドセキュリティプラットフォームのWizと統合しました。このアーキテクチャでは、8つの原子型ツールを介してNorthからWizのGraphQL APIへ接続し、単一のプロンプトからインシデント対応ワークフローを自動化します。本システムは、攻撃チェーンを評価し、インターネットへの公開度合いや権限レベルに基づいてリスクをランク付けすることで、毒性のある組み合わせによる被害範囲(blast radius)分析を約20秒で実行します。さらに、問題の詳細取得、Linearチケットの作成、Wizステータスの更新、構造化されたインシデント対応レポートのドラフト作成により、エンドツーエンドの調査プロセスも自動化しています。加えて、毎週月曜朝に手動介入なしでセキュリティ姿勢(security posture)のブリーフを生成する定期的な自動化機能も備えています。この統合により、各発見事項に対して以前必要だった30分〜2時間のトリアージループが解消され、エンジニアは生のアラートではなく評価内容の評価に集中できるようになります。

lab OpenAI News · 6日前

OpenAIの研究、AIエージェントが仕事を変革していることを示す

OpenAIからの新しい研究論文は、人工知能エージェントが仕事の性質を根本的にどのように変えているかを示しています。この研究は、これらのエージェントが以前よりも長く、より複雑なタスクを実行する能力に焦点を当てています。この技術的進歩は、幅広い職業役割全体で生産性を拡大したと評価されています。調査結果は、自動化を通じて労働の組織化と実行方法に大きな変化が生じることを示唆しています。AIエージェントが複雑なワークフローを処理することで、ユーザーはより高い効率を達成できるようになっています。論文は、自律型システムが現代の雇用にもたらす影響が増大していることの証拠となっています。

lab Claude Code Releases · 7日前

Claude Code v2.1.191 リリースノート

Claude Code バージョン 2.1.191 は、/clear コマンドが実行される前の会話から再開できるようにする /rewind サポートを導入しました。このアップデートは、停止されたバックグラウンドエージェントが復活したり、ストリーミング応答中にスクロール位置がジャンプしたりするなどの深刻な問題のいくつかを修正します。また、/voice が汎用的なエラーメッセージを表示したり、Windows Terminal で /login URL が切り捨てられたりする動作も修正されました。MCP サーバーの信頼性を大幅に向上させるため、機能検出と OAuth フロー中に一時的なネットワークエラーが発生した場合のリトライロジックが追加されました。ヘッドレス環境では、OAuth のブラウザポップアップがスキップされ、サンドボックスのネットワーク権限はセッション期間中記憶されます。パフォーマンスの最適化により、テキスト更新の結合を通じてストリーミング中の CPU 使用率が約 37% 削減され、ターミナル出力キャッシュによる長時間セッションでのメモリ増加も緩和されました。