すべての記事
github llama.cpp · 3時間前

llama.cpp b9859 リリースで OpenCL プリコンパイル済みカーネルサポートが追加

llama.cpp の b9859 リリースは、OpenCL 用のプリコンパイル済みバイナリカーネルをライブラリからロードする機能を導入し、特に Adreno GPU を対象としています。このアップデートでは、CPU、GPU、および各種アクセラレータバックエンドに対して、macOS、Linux、Windows、Android、openEuler のバイナリも提供されます。

lab xAI News · 4時間前

xAI、Grok Voice向けノーコード音声エージェントビルダーをリリース

xAIは、Grok Voice上で2分以内に本番環境対応の音声エージェントを設定できるノーコードプラットフォーム「Voice Agent Builder」のベータ版を公開した。このツールにより、運用担当者や開発者は、基礎となるテレフォニーやAIスタックを一から構築することなく、高ボリュームの音声エージェントを展開できる。

github llama.cpp · 6時間前

llama.cpp b9857 リリース: Flash Attention の再構築と新バイナリ

llama.cpp b9857 リリースは、Hexagon Flash Attention 実装の包括的な再構築を導入し、最適化と精度の向上に重点を置いています。このアップデートには、hex-mm および hex-fa モジュールへの変更が含まれており、例えば量子化タスクをメインの行列乗算スレッドに統合したり、ADD 操作と融合させたり、マスク処理を最適化したりしています。

lab Anthropic News · 19時間前

米国輸出規制後、AnthropicがFable 5を再デプロイ

Anthropicは、米政府がすべてのユーザーの利用を停止していた輸出規制を解除したため、Claude Fable 5およびMythos 5モデルへのグローバルアクセスを再開している。Fable 5は7月1日よりClaudeプラットフォームでグローバルに利用可能となり、7月7日までの間は使用制限が適用され、その後はクレジットベースのアクセスに移行する。

github llama.cpp · 19時間前

llama.cpp b9851 リリースでCUDAの整数切り捨てが修正され、バイナリが提供される

llama.cppプロジェクトはバージョンb9851をリリースしました。このバージョンには、flash_attn_mask_to_KV_maxカーネルにおける整数切り捨ておよびオーバーフローエラーを防ぐためのCUDA修正が含まれています。このアップデートは、指定されたカーネル内のKQマスクストライドに関連する問題を解決します。

github llama.cpp · 19時間前

llama.cpp b9850 リリース: Qwen3 の修正と新しいバイナリ

llama.cpp b9850 リリースでは、特定のモデルサポートの更新が導入されました。これには、Qwen3Next 用の t_layer_inp テンソルの登録、レイヤー処理ループ内の入力割り当ての修正、qwen-coder-next に対する DFLASH の問題への対処が含まれます。また、Qwen3 モデルの注意機構正規化用のテンソルも追加されました。

lab Microsoft Research Blog · 1日前

SkillOpt: エージェントのスキルをトレーニング可能なパラメータとして扱う

Microsoft Researchは、エージェントのスキルファイルを凍結されたターゲットモデルの外側でトレーニング可能なパラメータとして扱い、手動のスキル編集を制御された最適化プロセスに変換する手法「SkillOpt」を紹介します。このアプローチは、基盤となるモデルの重みを更新することなく、エージェントの信頼性と一貫性を向上させます。

lab Anthropic News · 1日前

科学者向けのAIワークベンチ「Claude Science」が利用可能に

Anthropicは、断片化された科学ツールを単一の研究環境に統合するために設計されたAIワークベンチであるClaude Scienceのベータ版をリリースしました。このプラットフォームは、監査可能な成果物、柔軟なコンピューティングスケーリング、ゲノミクスや構造生物学などの分野向けの専門エージェントを提供することで、発見を加速することを目指しています。

lab Anthropic News · 1日前

Claude Sonnet 5 の発表

Anthropic は、Claude Sonnet 5 をリリースしました。これは、以前の Opus クラスのモデルよりも低コストで、複雑な計画策定、ツール使用、自律的なコーディングタスクを実行するために設計された新しいエージェント型 AI モデルです。このアップデートは、Opus 4.8 とのパフォーマンス格差を縮めると同時に、その前身である Sonnet 4.6 と比較して、推論、安全性、実行において大幅な改善をもたらしました。

lab OpenAI News · 1日前

GeneBench-Proの内部:複雑なゲノム推論の10事例研究

GeneBench-Proは、複雑なゲノム推論タスクにおいてモデルを評価するために設計されたベンチマークで、代表的な質問と支援資料を紹介する10の詳細な事例研究を特徴としています。各事例研究では、特定の生物学的課題に対するモデルのパフォーマンスを評価するために必要な元のプロンプト、データセット、およびコンテキストを提供します。