すべての記事 — korshunov.ai

すべての記事ページ 1 / 5

macOS、Linux、Windowsバイナリを含むllama.cpp b9843リリース

llama.cppプロジェクトは、b9843リリースを公開しました。これにより、macOS、Linux、Android、Windows、openEulerの各プラットフォーム向けに、さまざまなハードウェアアーキテクチャに対応したビルド済みバイナリが提供されます。

github LangGraph · 1日前

LangGraph 1.2.7 リリースノート

LangGraph バージョン 1.2.7 がリリースされ、LangChain エコシステム向けのバグ修正と依存関係の更新が導入されました。

lab Microsoft Research Blog · 1日前

Memora: 抽象化と具体性のバランスを取る調和型メモリ表現

Microsoft Researchは、長期のAIタスクにおいて抽象化と具体性のバランスを取るために設計されたスケーラブルなエージェント型メモリフレームワークであるMemoraを発表しました。このシステムは、豊富なメモリコンテンツを軽量な検索構造から分離し、ベンチマークで新たな最先端の結果を達成しながら、コンテキストトークンを最大98%削減します。

lab Claude Code Releases · 1日前

Claude Code v2.1.196 リリースノート

Claude Code バージョン 2.1.196 は、組織デフォルトモデル、クリック可能なファイル添付、MCP サーバー承認のセキュリティ強化を導入します。このアップデートは、バックグラウンドセッションの信頼性を向上させ、さまざまなエージェントステータスレポートの問題を修正し、コードレビューワークフローでのトークン使用量を最適化します。

lab Google — The Keyword (AI) · 2日前

AIの専門家に聞く：フルスタックとは何か

Googleの専門家が、人工知能におけるフルスタックアプローチの概念を解説する。本記事は、この包括的な手法がGoogleのAI研究の基盤として長年にわたり機能してきたことを強調している。

github llama.cpp · 2日前

llama.cpp b9842 リリース: /v1/models におけるプリセットとキャッシュ済みモデルエントリの重複排除

llama.cpp b9842 リリースでは、/v1/models エンドポイントにおけるプリセットおよびキャッシュ済みモデルエントリの重複排除に関する変更が導入されました。このアップデートは、Hugging Face の Adrien Gallouët によって承認されています。

lab Meta AI / FAIR Blog · 2日前

Brain2Qwerty v2が非侵襲的な脳からテキストへの変換で61%の単語精度を達成

研究者らは、外科的インプラントなしで磁気脳波（MEG）記録からリアルタイムの文章を解読する非侵襲型AIパイプラインであるBrain2Qwerty v2を公開した。このシステムは全体として61%の単語精度を達成し、上位層では78%に達し、以前の非侵襲的手法を大幅に上回っている。

github llama.cpp · 2日前

llama.cpp b9840 リリースで DeepSeek V4 のサポートとマルチプラットフォームバイナリが追加

llama.cpp b9840 リリースは、Pro バリアントの特定の処理を含む DeepSeek V4 モデルの変換サポートを導入しました。このアップデートでは、新しいアーキテクチャをライブラリに統合し、各種内部最適化とバグ修正を行いました。

lab OpenAI News · 2日前

ヨーロッパのAI労働力機会をマッピングする

OpenAI Economic Researchは、ESCO分類とEurostatデータを活用し、AIの能力が加盟国全体の労働市場をどのように再構築するかを分析するために、AI雇用移行フレームワークを欧州連合に拡張しました。

github llama.cpp · 2日前

Tailwindスキャン修正とマルチプラットフォームバイナリを含むllama.cpp b9839リリース

llama.cppプロジェクトは、無視されたワークツリーでTailwindスキャンを復元する修正を含むバージョンb9839をリリースしました。このアップデートでは、macOS、Linux、Android、Windows、openEuler向けのプリビルドバイナリが、さまざまなアーキテクチャとハードウェアアクセラレーションバックエンドで提供されています。

github llama.cpp · 2日前

llama.cpp b9838 リリース: macOS、Linux、Windows、Android 向けビルド

llama.cpp プロジェクトはバージョン b9838 をリリースし、幅広いオペレーティングシステムとハードウェアアクセラレータ向けのプリビルドバイナリを提供しました。このリリースでは、macOS、Linux、Windows、Android、openEuler 上で、CPU、GPU（CUDA、Vulkan、ROCm、OpenCL）、および専用 AI アクセラレータのサポートが含まれています。

lab OpenAI News · 2日前

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。

github llama.cpp · 3日前

UI停止と推論スキップの修正を含むllama.cpp b9835リリース

llama.cppプロジェクトは、シングルモデルモードでの停止および推論スキップ機能の修正を含むバージョンb9835をリリースしました。このアップデートは、モデル推論中の制御を改善するためにユーザーインターフェース内の特定の問題に対処しています。

github llama.cpp · 3日前

llama.cpp b9833 リリース: MiniCPM5 パーサーとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9833 をリリースし、MiniCPM5 モデル専用のパーサーをはじめとする各種バグ修正とリファクタリングを導入しました。このアップデートには、ツール呼び出しのパーシング対応、文法の簡略化、Jinja2 基準との互換性を確保するための Jinja API の動作修正が含まれます。

github llama.cpp · 3日前

llama.cpp b9832 リリースで --dump-prog デバッグフラグが追加

llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。

github llama.cpp · 3日前

llama.cpp b9831 リリースで DFlash サポートと新しいバイナリが追加

llama.cpp の b9831 リリースでは、レイヤータイプごとのスライディングウィンドウアテンションを含む DFlash v2 サポートが導入され、複数のプラットフォーム向けの包括的なビルド済みバイナリセットも提供されています。

github llama.cpp · 3日前

llama.cpp b9830 リリースで --offline フラグが追加され、メモリバグが修正される

llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。

github llama.cpp · 3日前

llama.cpp b9829 リリース: ログの削減とマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9829 をリリースしました。これには、サーバー、共通コンポーネント、推測的デコーディングモジュールでのログ出力の削減が含まれます。このアップデートでは、CMN_ から COM_ への置換により命名規則が標準化されました。

github llama.cpp · 3日前

llama.cpp b9828 リリース: OpenCL Flash Attention の改善と新しいバイナリ

llama.cpp b9828 リリースは、f16 および f32 精度の Flash Attention カーネルを再構築するなど、OpenCL の大幅な強化をもたらしました。このアップデートには、新しいプレフィルプリパスカーネルと q4_0 および q8_0 量子化形式のサポートが含まれます。

github llama.cpp · 4日前

llama.cpp b9827 リリースで CUDA 2D 非同期コピーの最適化が追加

llama.cpp b9827 リリースは、ggml_cuda_cpy 関数に cudaMemcpy2DAsync の高速パスを追加することで、CUDA のパフォーマンス最適化を導入します。この変更により、テンソルが完全に連続していないものの各行が連続している場合の、同じ型・同じ形状のストライド付きコピーを高速化し、従来の要素ごとのスカラーコピーカーネルに代わります。