すべての記事
media Hugging Face Forums · 2日前

アーキテクチャ提案:オープンソースAIのための認識論的敵対ネットワーク(EAN)

ある機能リクエストは、認識論的敵対ネットワーク(EAN)を提案しています。これは、AIを機関の合意を反映するシステムから、分散型で多角的な検証エンジンへと変革するために設計されたアーキテクチャです。このアプローチは、単一の「真実の源」モデルを排除することで、政治的および企業の権力闘争を排除することを目指しています。

github llama.cpp · 2日前

Asahi Linux向けVulkan行列積最適化を含むllama.cpp b9846リリース

llama.cppプロジェクトは、Asahi Linux向けのVulkanバックエンド最適化を含むバージョンb9846をリリースしました。このアップデートでは、Apple Siliconハードウェア上でLinuxを実行する環境における互換性とパフォーマンスを向上させるため、行列積のブロックサイズループをロールバックしています。

media Hugging Face Forums · 3日前

AgentSeal: SWE-bench Proのコーパス可用性監査

AgentSeal v5監査ツールは、SWE-bench Proベンチマークにおけるアーティファクトの公開可用性を評価し、潜在的なコンタミネーションリスクを検証した。研究により、12件のインスタンスで決定論的なコンテンツ重複が確認され、76件のリポジトリがコーパスメンバーである可能性が高いことが判明したが、大半のエビデンスはカットオフ以前のコンタミネーションではなく、日付不明の公開複製であった。

lab Microsoft Research Blog · 3日前

Memora: 抽象化と具体性のバランスを取る調和型メモリ表現

Microsoft Researchは、長期のAIタスクにおいて抽象化と具体性のバランスを取るために設計されたスケーラブルなエージェント型メモリフレームワークであるMemoraを発表しました。このシステムは、豊富なメモリコンテンツを軽量な検索構造から分離し、ベンチマークで新たな最先端の結果を達成しながら、コンテキストトークンを最大98%削減します。

lab Claude Code Releases · 3日前

Claude Code v2.1.196 リリースノート

Claude Code バージョン 2.1.196 は、組織デフォルトモデル、クリック可能なファイル添付、MCP サーバー承認のセキュリティ強化を導入します。このアップデートは、バックグラウンドセッションの信頼性を向上させ、さまざまなエージェントステータスレポートの問題を修正し、コードレビューワークフローでのトークン使用量を最適化します。