すべての記事 — korshunov.ai

すべての記事ページ 1 / 21

参加するために理解する

Geoffrey Littは、開発者が認知負債を避け、創造的プロセスにおいてアクティブな参加者であり続けるために、コーディングエージェントによって生成されたコードを深く理解しなければならないと主張している。

OpenLumaraがOpenAIエンドポイント経由で任意のUIとローカルモデルを接続

オープンソースフレームワークのOpenLumaraは、KoboldLiteやOpenWebUIなど、OpenAIエンドポイントと通信できる任意のユーザーインターフェースへの接続をサポートするようになりました。このアップデートにより、ユーザーは好みのフロントエンドを変更せずに、トークン効率の高いハーネスを既存のワークフローに統合できます。

media r/LocalLLaMA · 2時間前

QGISのようなソフトウェアで大規模な空間データや都市レイアウトの生成にローカルLLMを使用していますか？

あるユーザーは、都市全体のレイアウト、道路網、複雑なグリッドシステムなど、大規模な構造化データを生成できるローカル言語モデルの推奨を求めています。

media r/LocalLLaMA · 4時間前

デュアルR9700: Qwen3.6 27Bの最適な公式は？

あるユーザーが、llama.cppを使用してデュアルAMD Radeon R9700構成でQwen3.6-27Bモデルを最適化し、VulkanとROCmバックエンド間のパフォーマンスを比較しています。

media r/LocalLLaMA · 4時間前

Gemma 4 WebGPUカーネルが255 tok/sを達成

XenovaはGemma 4用のWebGPUカーネルをリリースし、255トークン/秒のパフォーマンスを実現しました。この最適化により、密集モデルがウェブブラウザで100 T/sを超える速度で実行可能になります。

blog Simon Willison · 4時間前

DSPyを使用してDatasette AgentのSQLシステムプロンプトを評価・改善する

Simon WillisonはClaude CodeとFable 5モデルを使用して、Datasette Agentのシステムプロンプトの評価と最適化を自動化しました。これは特に読み取り専用SQLクエリ実行機能に焦点を当てています。このプロセスには、最新のDatasette alpha版とDSPyのインストールが含まれ、エージェントがスキーマ情報をどのように処理するかにおける弱点の特定を目指しました。

media r/LocalLLaMA · 4時間前

NvidiaのAIパイオニアがAGIを否定し、OpenAIとAnthropicをAOLに例える

Nvidiaの著名な人物は、人工一般知能（AGI）を信じておらず、業界の焦点は企業向けの個別カスタマイズされたオープンソースモデルへ移行すべきだと主張している。

media r/LocalLLaMA · 5時間前

RTX 3090でのローカルベンチマーク - Qwen3.6 27b vs Ornith

あるユーザーが、RTX 3090上でinspect-aiフレームワークを使用してQwen3.6 27b、Gemma4 26B A4B QAT、およびOrnith1.0 35B MoEを比較し、ローカルモデルのパフォーマンスを評価しました。テストの結果は、一般知識、グラウンディング、コーディングのベンチマークで混合したものであり、Qwen3.6がスコアで一般的にリードしましたが、OrnithはDROPのような特定分野で強みを見せました。

media Hugging Face Forums · 6時間前

認識的ストレステスト — Claude Sonnet 5 が MarCognity-AI によって検証される

本記事は、Claude Sonnet 5 の検証について記述しており、MarCognity-AI の Skeptical Agent を用いて、テキスト上の自信と実際の検証可能性の間のギャップ、「認識的亀裂」を明らかにしました。

media Hugging Face Forums · 6時間前

Aiywinフレームワーク、AI推論に螺旋再帰を提案

独立開発者のAiywin.aiは、標準的な線形処理を螺旋再帰ループに置き換え、異常や不完全なデータを処理する認知フレームワークを導入しました。このシステムは、停止したり幻覚を起こしたりするのではなく、構造化された解決策が見つかるまで文脈パラメータを数学的に拡張します。

media Hugging Face Forums · 6時間前

複数タスクにおけるSoloとMoAのベンチマーク

本記事は、個別モデルとMixture-of-Agents (MoA) 構成を6つのタスク（Bug、Tool、Arch、Clinical、DLQ、および総合平均）で比較したベンチマーク結果を示しています。評価ハーネスにはHermes Agent v0.18が使用され、スコアは正確性、完全性、深さ、実行可能性、明瞭性、信頼性を重み付けしたルーブリックに基づきChatGPT 5.5とClaude opus 4.8によって生成されました。

media r/LocalLLaMA · 7時間前

ユーザーが火災や煙を検出するビジョンモデルを求めている

あるRedditユーザーは、7月4日の花火シーズン中に燃えかすの監視という文脈で、火災や煙を検出できるビジョンモデルの推奨を求めています。

media r/LocalLLaMA · 8時間前

2.3kのローカルAIアプリの分析により82カテゴリと多様なユースケースが判明

Mac App Storeの分析により、スクレイピングされた20,000件以上のエントリーの中から2,259件のローカルAIアプリケーションが特定され、モデルを特定のワークフローとパッケージ化するニッチなツールの成長するエコシステムが浮き彫りになった。この調査は82の異なるカテゴリをカバーしており、文字起こしやOCRのような一般的なタスクから、 Wardrobe styling（衣類スタイリング）やペットの健康支援のような専門的な機能まで含まれる。

media r/LocalLLaMA · 8時間前

コピーライティングスコアでEqBench3に+Elo 290のGemma-4-31B微調整

あるユーザーが、コピーライティングおよびクリエイティブライティングタスク用に特別に最適化されたGemma-4-31B-itモデルの狭義ファインチューンを公開しました。このモデルは、一般的なマーケティングの陳腐な表現を排除し、具体的内容と緊迫した行動喚起（CTA）で特徴づけられるダイレクトレスポンススタイルを採用するよう訓練されました。

media r/LocalLLaMA · 9時間前

MiniMax M2.7 Q3 XLを6枚のNVIDIA P40 GPUで実行

あるユーザーが、MiniMax M2.7 Q3_K_XLモデルを6枚のNVIDIA Tesla P40 GPUにわたって正常にデプロイした詳細を記載しており、ローカルLLMホスティング用の完全なハードウェア構成と最適化された推論設定を提供しています。

github llama.cpp · 11時間前

llama.cpp b9860 リリースで llama_ftype_name API が追加

llama.cpp プロジェクトはバージョン b9860 をリリースし、モデルファイルのタイプ（量子化）名を公開する新しいパブリック C API 関数 `llama_ftype_name` を導入しました。

media r/LocalLLaMA · 11時間前

エージェントがLLM向けの強化学習に関する大規模なWikiを共同で作成中（これまでに200本以上の論文）、誰でも参加可能

AIエージェントが大規模言語モデル向けの強化学習について包括的なWikiを編纂している共同プロジェクトが進行中で、すでに200本以上の研究論文を処理済みです。

media r/LocalLLaMA · 11時間前

オープンソース開発者への感謝を促すReddit投稿

あるRedditユーザーが、コミュニティの取り組みの好例としてvLLMの最近の急速なアップデートを引用し、オープンソース貢献者への感謝の重要性を強調しています。

media r/LocalLLaMA · 11時間前

Gemma 4 31bを再構築中…より良く…26bとして…

ある開発者が、パラメータ数を約26Bに削減しつつパフォーマンスの向上を目指し、Gemma 4 31Bモデルを再構築する計画を明らかにしました。このプロジェクトには、アーキテクチャの変更、特定のトレーニング手法、データセットのキュレーションが含まれ、より小さく効率的なモデルの作成を目指します。

media r/LocalLLaMA · 11時間前

poolside/Laguna-XS-2.1

本記事は、Hugging Faceのpoolside組織の下で公開されているモデルLaguna-XS-2.1のリリースを発表しています。