すべての記事
github llama.cpp · 6日前

llama.cpp b9804 リリース: Mamba2 の修正と新しいバイナリ

llama.cpp b9804 リリースは、Mamba2 アーキテクチャの修正を導入しました。これは、ハードコードされた 2 倍の展開係数と無効なパラメータチェックを削除し、任意の展開値をサポート可能にします。この変更により、`convert_hf_to_gguf.py` スクリプトが更新され、展開パラメータがデフォルト値 2 でオプションとなりました。

media Hugging Face Forums · 6日前

JoeBro: 依存関係ゼロのネイティブmacOS AIワークスペース

JoeBroは、pipやDockerなどの外部依存関係を必要とせずにAIワークスペースを提供するために設計された、ローカルファーストのネイティブmacOSアプリケーションです。バンドルされたPythonバックエンドとSQLiteストレージを備え、すべてのデータをユーザーのマシン上に保持し、テレメトリやアカウント要件を排除します。

github llama.cpp · 6日前

OpenCLプロファイリング修正を含むllama.cpp b9803リリース

llama.cppプロジェクトは、不完全なバッチのシャットダウン時にプロファイリングバッチをフラッシュするOpenCLの修正を含むバージョンb9803をリリースしました。このアップデートにより、macOS、Linux、Windows、Android、openEuler向けに、さまざまなハードウェアバックエンド用のバイナリが提供されます。

github llama.cpp · 6日前

llama.cpp b9802 リリースで macOS、Linux、Windows、Android のバイナリが提供される

llama.cpp プロジェクトは、複数のオペレーティングシステムとハードウェアアーキテクチャにわたってビルド済みバイナリを提供する b9802 リリースを公開しました。このアップデートには、macOS、Linux、Windows、Android、openEuler などのプラットフォームにおける CPU、GPU、および専用 AI アクセラレータのサポートが含まれています。

lab Cohere Blog · 7日前

AIエージェントによるフォークメンテナンスの自動化

本記事では、AIコーディングエージェントを使用してソフトウェアフォークのメンテナンスを自動化する方法について説明し、vLLMのCohereによるフォークに適用しています。このアプローチは、手動介入を自動フィードバックループに置き換えることで、上流からのリリースを取り込むのに必要な時間を数週間から数日に圧縮します。

lab Microsoft Research Blog · 7日前

AI駆動の説明と実験による脳の理解

研究者らは、解釈不可能なLLMベースの脳予測モデルを、皮質機能に関する簡潔で検証可能な言語仮説に変換するフレームワークである生成因果テスト(GCT)を開発した。この手法は、モデルのパラメータを「食品の準備」など特定の脳領域が何に反応するかを記述する短いフレーズに凝縮し、その後、標的型fMRI実験を通じてこれらの説明を検証する。

lab Hugging Face Blog · 7日前

ハイブリッド言語モデルにおけるトークン予測精度の分析

最近の研究は、標準的な密なアーキテクチャと比較して、ハイブリッド言語モデルがどの特定のトークンをより正確に予測するかを調査しています。この研究は、稀な単語やコードスニペットなどの異なるトークンタイプ全体での予測誤差の分布を理解することに焦点を当てています。損失地形を分析することで、著者たちはハイブリッドモデルがスパースデータ領域における長距離依存性の捕捉に優れていることを特定しました。知見は、エキスパートミキシングメカニズムが推論中により効率的なパラメータ利用を可能にすることを示唆しています。この精度の向上は、トレーニングコーパスで低頻度のトークンにおいて特に顕著です。論文は、さまざまなベンチマークデータセット全体のパフォーマンス指標の詳細な内訳を提供しています。これらの結果は、多様な言語構造を効果的に処理するためのハイブリッドアーキテクチャの可能性を浮き彫りにしています。

lab Cohere Blog · 7日前

CohereがカスタムMCPサーバー経由でNorthとWizを活用しインシデント対応を自動化

Cohereは、エンタープライズAIプラットフォーム「Cohere North」を用いてセキュリティエージェントを開発し、カスタムModel Context Protocol (MCP)サーバーを通じてクラウドセキュリティプラットフォームのWizと統合しました。このアーキテクチャでは、8つの原子型ツールを介してNorthからWizのGraphQL APIへ接続し、単一のプロンプトからインシデント対応ワークフローを自動化します。本システムは、攻撃チェーンを評価し、インターネットへの公開度合いや権限レベルに基づいてリスクをランク付けすることで、毒性のある組み合わせによる被害範囲(blast radius)分析を約20秒で実行します。さらに、問題の詳細取得、Linearチケットの作成、Wizステータスの更新、構造化されたインシデント対応レポートのドラフト作成により、エンドツーエンドの調査プロセスも自動化しています。加えて、毎週月曜朝に手動介入なしでセキュリティ姿勢(security posture)のブリーフを生成する定期的な自動化機能も備えています。この統合により、各発見事項に対して以前必要だった30分〜2時間のトリアージループが解消され、エンジニアは生のアラートではなく評価内容の評価に集中できるようになります。