Wmf - 新しい実験的手法
記事の内容は著者によって削除され、この手法に関する実質的な情報は残されていません。
記事の内容は著者によって削除され、この手法に関する実質的な情報は残されていません。
非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。
Together AIは、プラットフォーム開発のフルスタックをカバーする9つの論文をICML 2026で発表します。
Hugging FaceとCerebrasは、GoogleのGemma 4モデルを自社のプラットフォームに統合し、リアルタイム音声人工知能アプリケーションを実現しました。このコラボレーションにより、開発者は低遅延の音声処理タスクのためにGemma 4のマルチモーダル機能を活用できます。
同社は、オープンソース人工知能への移行を加速させることを目的としたシリーズC資金調達で8億ドルを調達しました。
本記事では、エンタープライズJavaアプリケーションを異なるフレーム間で移行する際のAIエージェントのパフォーマンスを評価するために設計されたベンチマークであるScarfBenchを紹介します。 この研究は、フレームワーク移行の複雑さを浮き彫りにし、この分野におけるエージェントの能力を評価するための標準化された評価方法を提案しています。
crewAI 1.15.2a1 リリースでは、エージェントオーケストレーションフレームワーク向けの新機能、バグ修正、ドキュメント更新がいくつか導入されました。
llama.cpp b9857 リリースは、Hexagon Flash Attention 実装の包括的な再構築を導入し、最適化と精度の向上に重点を置いています。このアップデートには、hex-mm および hex-fa モジュールへの変更が含まれており、例えば量子化タスクをメインの行列乗算スレッドに統合したり、ADD 操作と融合させたり、マスク処理を最適化したりしています。
llama.cpp プロジェクトはバージョン b9855 をリリースしました。これは、ggml-cpu バックエンド内で UE4M3 ルックアップテーブル (LUT) を使用した nvfp4 ドット積の AVX2 最適化を導入しています。
llama.cppプロジェクトはバージョンb9856をリリースし、CUDAにおけるFlash Attentionで`restrict`キーワードとPDLの一貫した使用を導入しました。このアップデートには、macOS、Linux、Android、Windows、openEuler向けの各種ハードウェアバックエンド用のビルド済みバイナリが含まれています。
今回のアップデートでは、プログレッシブウェブアプリ(PWA)のナビゲーションフォールバックメカニズムが削除されました。この変更は、APIエンドポイントリクエストの意図しないキャッシュを防ぐために実装されています。
llama.cpp プロジェクトはバージョン b9852 をリリースし、q1_0 量子化フォーマットに対する初期の OpenCL サポートを導入しました。このアップデートには、一般的な q1_0 の機能と、OpenCL デバイス用の特定の Adreno GEMM/GEMV 実装が含まれています。
Anthropicは、米政府がすべてのユーザーの利用を停止していた輸出規制を解除したため、Claude Fable 5およびMythos 5モデルへのグローバルアクセスを再開している。Fable 5は7月1日よりClaudeプラットフォームでグローバルに利用可能となり、7月7日までの間は使用制限が適用され、その後はクレジットベースのアクセスに移行する。
llama.cppプロジェクトはバージョンb9851をリリースしました。このバージョンには、flash_attn_mask_to_KV_maxカーネルにおける整数切り捨ておよびオーバーフローエラーを防ぐためのCUDA修正が含まれています。このアップデートは、指定されたカーネル内のKQマスクストライドに関連する問題を解決します。
llama.cpp b9850 リリースでは、特定のモデルサポートの更新が導入されました。これには、Qwen3Next 用の t_layer_inp テンソルの登録、レイヤー処理ループ内の入力割り当ての修正、qwen-coder-next に対する DFLASH の問題への対処が含まれます。また、Qwen3 モデルの注意機構正規化用のテンソルも追加されました。
Model Context Protocol (MCP) Python SDKが、2026-07-28 MCP仕様の完全なサポートを導入する最初のベータ版 v2.0.0b1 をリリースしました。このプレリリースはオプトインのみであり、標準インストールが安定した1.xラインに解決され続けることを保証します。
Microsoft Researchは、エージェントのスキルファイルを凍結されたターゲットモデルの外側でトレーニング可能なパラメータとして扱い、手動のスキル編集を制御された最適化プロセスに変換する手法「SkillOpt」を紹介します。このアプローチは、基盤となるモデルの重みを更新することなく、エージェントの信頼性と一貫性を向上させます。
Anthropicは、断片化された科学ツールを単一の研究環境に統合するために設計されたAIワークベンチであるClaude Scienceのベータ版をリリースしました。このプラットフォームは、監査可能な成果物、柔軟なコンピューティングスケーリング、ゲノミクスや構造生物学などの分野向けの専門エージェントを提供することで、発見を加速することを目指しています。
Anthropic は、Claude Sonnet 5 をリリースしました。これは、以前の Opus クラスのモデルよりも低コストで、複雑な計画策定、ツール使用、自律的なコーディングタスクを実行するために設計された新しいエージェント型 AI モデルです。このアップデートは、Opus 4.8 とのパフォーマンス格差を縮めると同時に、その前身である Sonnet 4.6 と比較して、推論、安全性、実行において大幅な改善をもたらしました。
AnthropicはClaude Codeのバージョン2.1.197をリリースし、デフォルトモデルをClaude Sonnet 5に更新しました。この新モデルはネイティブの1Mトークンコンテキストウィンドウを備え、8月31日までプロモーション価格で利用可能です。