すべての記事 — korshunov.ai

すべての記事ページ 1 / 19

Wmf - 新しい実験的手法

記事の内容は著者によって削除され、この手法に関する実質的な情報は残されていません。

MacBook M5 ProでのローカルLLM - この分野の完全な初心者！

非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。

media Together AI Blog · 15時間前

ICML 2026におけるTogether AI: フルスタックにわたるフロンティア研究

Together AIは、プラットフォーム開発のフルスタックをカバーする9つの論文をICML 2026で発表します。

lab Hugging Face Blog · 16時間前

Hugging FaceとCerebrasがGemma 4をリアルタイム音声AIに導入

Hugging FaceとCerebrasは、GoogleのGemma 4モデルを自社のプラットフォームに統合し、リアルタイム音声人工知能アプリケーションを実現しました。このコラボレーションにより、開発者は低遅延の音声処理タスクのためにGemma 4のマルチモーダル機能を活用できます。

media Together AI Blog · 16時間前

オープンソースAIへの移行を加速させるための8億ドルのシリーズC資金調達を発表

同社は、オープンソース人工知能への移行を加速させることを目的としたシリーズC資金調達で8億ドルを調達しました。

lab Hugging Face Blog · 16時間前

ScarfBench: エンタープライズJavaフレームワーク移行におけるAIエージェントのベンチマーク

本記事では、エンタープライズJavaアプリケーションを異なるフレーム間で移行する際のAIエージェントのパフォーマンスを評価するために設計されたベンチマークであるScarfBenchを紹介します。この研究は、フレームワーク移行の複雑さを浮き彫りにし、この分野におけるエージェントの能力を評価するための標準化された評価方法を提案しています。

github CrewAI · 17時間前

crewAI 1.15.2a1 リリースノート

crewAI 1.15.2a1 リリースでは、エージェントオーケストレーションフレームワーク向けの新機能、バグ修正、ドキュメント更新がいくつか導入されました。

lab Google — The Keyword (AI) · 20時間前

NYCの教育者や業界リーダーがGoogleに集まり、教室でのAIを形作る

Google、ニューヨーク・ジョブズCEO評議会、Urban Assemblyは、Googleのオフィスで150人の教育および業界リーダーを対象にAIサミットを開催した。このイベントは、教室環境における人工知能の統合の将来を議論し、形成するためにステークホルダーを集めた。

lab Google — The Keyword (AI) · 20時間前

Googleの最新AIニュース、2026年6月に発表

この記事では、2026年6月にGoogleが発表した人工知能のアップデートと発表内容のまとめを掲載しています。

github llama.cpp · 21時間前

llama.cpp b9859 リリースで OpenCL プリコンパイル済みカーネルサポートが追加

llama.cpp の b9859 リリースは、OpenCL 用のプリコンパイル済みバイナリカーネルをライブラリからロードする機能を導入し、特に Adreno GPU を対象としています。このアップデートでは、CPU、GPU、および各種アクセラレータバックエンドに対して、macOS、Linux、Windows、Android、openEuler のバイナリも提供されます。

lab xAI News · 22時間前

xAI、Grok Voice向けノーコード音声エージェントビルダーをリリース

xAIは、Grok Voice上で2分以内に本番環境対応の音声エージェントを設定できるノーコードプラットフォーム「Voice Agent Builder」のベータ版を公開した。このツールにより、運用担当者や開発者は、基礎となるテレフォニーやAIスタックを一から構築することなく、高ボリュームの音声エージェントを展開できる。

github llama.cpp · 23時間前

HFモデルパス修正を含むllama.cpp b9858リリース

llama.cppプロジェクトは、Hugging Faceのプライマリスプリットをモデルパスとして使用する変更を含むバージョンb9858をリリースしました。このアップデートは、モデル読み込みパスに関する問題#25181を解決します。

github llama.cpp · 1日前

llama.cpp b9857 リリース: Flash Attention の再構築と新バイナリ

llama.cpp b9857 リリースは、Hexagon Flash Attention 実装の包括的な再構築を導入し、最適化と精度の向上に重点を置いています。このアップデートには、hex-mm および hex-fa モジュールへの変更が含まれており、例えば量子化タスクをメインの行列乗算スレッドに統合したり、ADD 操作と融合させたり、マスク処理を最適化したりしています。

github llama.cpp · 1日前

llama.cpp b9855 リリースで AVX2 nvfp4 最適化と新しいバイナリが追加

llama.cpp プロジェクトはバージョン b9855 をリリースしました。これは、ggml-cpu バックエンド内で UE4M3 ルックアップテーブル (LUT) を使用した nvfp4 ドット積の AVX2 最適化を導入しています。

github llama.cpp · 1日前

CUDAのrestrictとPDLによるFA対応を含むllama.cpp b9856リリース

llama.cppプロジェクトはバージョンb9856をリリースし、CUDAにおけるFlash Attentionで`restrict`キーワードとPDLの一貫した使用を導入しました。このアップデートには、macOS、Linux、Android、Windows、openEuler向けの各種ハードウェアバックエンド用のビルド済みバイナリが含まれています。

github llama.cpp · 1日前

APIエンドポイントリクエストのキャッシュを防ぐために、PWAナビゲーションフォールバックを削除

今回のアップデートでは、プログレッシブウェブアプリ（PWA）のナビゲーションフォールバックメカニズムが削除されました。この変更は、APIエンドポイントリクエストの意図しないキャッシュを防ぐために実装されています。

github llama.cpp · 1日前

llama.cpp b9852 リリースで OpenCL の q1_0 サポートが追加

llama.cpp プロジェクトはバージョン b9852 をリリースし、q1_0 量子化フォーマットに対する初期の OpenCL サポートを導入しました。このアップデートには、一般的な q1_0 の機能と、OpenCL デバイス用の特定の Adreno GEMM/GEMV 実装が含まれています。

lab Anthropic News · 2日前

米国輸出規制後、AnthropicがFable 5を再デプロイ

Anthropicは、米政府がすべてのユーザーの利用を停止していた輸出規制を解除したため、Claude Fable 5およびMythos 5モデルへのグローバルアクセスを再開している。Fable 5は7月1日よりClaudeプラットフォームでグローバルに利用可能となり、7月7日までの間は使用制限が適用され、その後はクレジットベースのアクセスに移行する。

github llama.cpp · 2日前

llama.cpp b9851 リリースでCUDAの整数切り捨てが修正され、バイナリが提供される

llama.cppプロジェクトはバージョンb9851をリリースしました。このバージョンには、flash_attn_mask_to_KV_maxカーネルにおける整数切り捨ておよびオーバーフローエラーを防ぐためのCUDA修正が含まれています。このアップデートは、指定されたカーネル内のKQマスクストライドに関連する問題を解決します。

github llama.cpp · 2日前

llama.cpp b9850 リリース: Qwen3 の修正と新しいバイナリ

llama.cpp b9850 リリースでは、特定のモデルサポートの更新が導入されました。これには、Qwen3Next 用の t_layer_inp テンソルの登録、レイヤー処理ループ内の入力割り当ての修正、qwen-coder-next に対する DFLASH の問題への対処が含まれます。また、Qwen3 モデルの注意機構正規化用のテンソルも追加されました。