すべての記事
lab OpenAI News · 1日前

GeneBench-Proの紹介

GeneBench-Proは、AIエージェントが計算生物学において曖昧さに対処し、重要な判断を下す能力を測定するために設計された研究レベルのベンチマークであり、元のGeneBenchを拡張したものです。これは、データノイズへの対応、仮定の修正、結果が意思決定に準備できているかどうかの判定といった高次な能力をテストすることで、現在の評価の限界に対処します。

github llama.cpp · 1日前

llama.cpp b9849 リリース: IPv6 URL 処理と新しいバイナリ

llama.cpp b9849 リリースでは、URL のホスト部における角括弧で囲まれた IPv6 リテラルのサポートが導入され、RFC 3986 に準拠して [host]:port 形式をサーバーが解析できるようになりました。この更新により、リッスンログ、プロキシヘッダー、クライアントの再構築の書式が適切に保たれつつ、リクエストごとの追跡のために bare remote_addr が維持されます。

github llama.cpp · 1日前

llama.cpp b9848 リリースで CUDA の get_rows_back が修正され、バイナリが提供される

llama.cpp プロジェクトはバージョン b9848 をリリースしました。このバージョンには、65535 行を超えるテーブルにおける `get_rows_back` 関数の問題を解決するための CUDA バックエンドの重要な修正が含まれています。このアップデートは、以前に大規模なテーブル操作に影響を与えていた grid-y クランプおよびストライドのエラーを修正します。

github llama.cpp · 1日前

Asahi Linux向けVulkan行列積最適化を含むllama.cpp b9846リリース

llama.cppプロジェクトは、Asahi Linux向けのVulkanバックエンド最適化を含むバージョンb9846をリリースしました。このアップデートでは、Apple Siliconハードウェア上でLinuxを実行する環境における互換性とパフォーマンスを向上させるため、行列積のブロックサイズループをロールバックしています。

lab Microsoft Research Blog · 2日前

Memora: 抽象化と具体性のバランスを取る調和型メモリ表現

Microsoft Researchは、長期のAIタスクにおいて抽象化と具体性のバランスを取るために設計されたスケーラブルなエージェント型メモリフレームワークであるMemoraを発表しました。このシステムは、豊富なメモリコンテンツを軽量な検索構造から分離し、ベンチマークで新たな最先端の結果を達成しながら、コンテキストトークンを最大98%削減します。

lab Claude Code Releases · 2日前

Claude Code v2.1.196 リリースノート

Claude Code バージョン 2.1.196 は、組織デフォルトモデル、クリック可能なファイル添付、MCP サーバー承認のセキュリティ強化を導入します。このアップデートは、バックグラウンドセッションの信頼性を向上させ、さまざまなエージェントステータスレポートの問題を修正し、コードレビューワークフローでのトークン使用量を最適化します。

github llama.cpp · 2日前

Tailwindスキャン修正とマルチプラットフォームバイナリを含むllama.cpp b9839リリース

llama.cppプロジェクトは、無視されたワークツリーでTailwindスキャンを復元する修正を含むバージョンb9839をリリースしました。このアップデートでは、macOS、Linux、Android、Windows、openEuler向けのプリビルドバイナリが、さまざまなアーキテクチャとハードウェアアクセラレーションバックエンドで提供されています。