すべての記事 — korshunov.ai

すべての記事ページ 1 / 20

PrismMLの1ビットBonsai-8BがIBM GraniteをGrammarによるCPUツール呼び出しで上回る

PrismMLの1ビットBonsai-8BモデルとIBMのGraniteおよび他のLLMとのベンチマークにより、Bonsai-8Bは文法制約付きデコーディングを使用する場合に最高のツール呼び出し精度を達成することが示されました。llama.cppを使用してCPUで実施されたこのテストは、出力制約が小さな量子化モデルをエージェントタスクで効果的に機能させるためにいかに重要かを示しています。

media r/LocalLLaMA · 8時間前

Lemonade SDKがRPG-HaloTales-V1をリリース、ローカルでのマルチメディアロールプレイに対応

Lemonade SDKは、ユーザーがローカルで実行できるマルチメディアロールプレイ体験を提供するために設計された新モデル「RPG-HaloTales-V1」をリリースしました。

media r/LocalLLaMA · 8時間前

NPC間会話用のオープンソースローカルLLM NPCバックエンド

著者は、クラウド依存なしでNPC間の直接対話を可能にする大規模言語モデル（LLM）NPC向けに設計された、完全にローカルの音声から音声へのバックエンドを公開しました。このシステムは、音声からテキストへの変換、ローカルLLM、およびテキストから音声への変換コンポーネントを統合し、NPC同士が対話したり、文脈を保持したり、将来のプレイヤーとの相互作用に影響を与えたりできるようにします。

media r/LocalLLaMA · 10時間前

3台のSpark構成に最適なコーディングモデルは？

あるユーザーが、3台のAsus Ascent GX10 (GB10) ユニットからなる専用ハードウェアセットアップ上で実行するための最適なコーディングモデルについて推奨を求めています。想定される同時実行数は5〜10名です。

media r/LocalLLaMA · 10時間前

Hugging FaceのAndi氏がGemma 4 31Bを使用した完全オープンソースの音声パイプラインを実演

Hugging FaceのAndi氏は、音声対話パイプラインを構築する完全オープンソースで無料のデモを公開しました。このシステムは、Nvidiaのparakeet、Cerebrasによって提供されるGemma 4 31Bモデル、およびQwen3TTSのカスタム推論を組み合わせています。

media r/LocalLLaMA · 10時間前

Z.aiがCursor、Claude Code、GitHub Copilotに挑戦するZCodeをリリース

Z.aiは、Cursor、Claude Code、GitHub Copilotのような確立されたプラットフォームと競争するために設計された新しいAIコーディングツールであるZCodeを導入しました。

media r/LocalLLaMA · 10時間前

Windows XP上のエージェント型AI向けSimpleLLMChat 1.2.5アップデート

開発者は、Windows XPと.NET 4.0を使用してレガシーマシンで実行するように設計されたエージェント型AIハネスであるSimpleLLMChatのバージョン1.2.5をリリースしました。

media r/LocalLLaMA · 10時間前

あるRedditユーザーが、コーディング、システム管理作業、小規模なコードベースを扱う個人プロジェクトにおける、検索拡張生成（RAG）の実用的な有用性について疑問を呈しています。著者は、標準的な業界知識はすでにモデルによって十分にカバーされていると主張し、コードベースやAPIリファレンスなどの特定のデータソースは、インデックス作成が必要になるほど大きくないか、効率的に管理するには大きすぎる場合があると述べています。

media r/LocalLLaMA · 10時間前

Palantir CEOがクローズドモデルを激しく批判

PalantirのCEO、アレックス・カープは、AnthropicとOpenAIが顧客への過剰課金とデータの不正利用を行ったとして公に非難した。この立場は、Palantirが最近、エンタープライズクライアント向けにローカルモデルを実行するためにNvidiaのチップを購入する契約を結んだことを受けてのものである。

media r/LocalLLaMA · 10時間前

構造化出力の信頼性を高める安価なトリック：再試行時にバリデーションエラーをフィードバックする

大規模言語モデルから構造化出力を生成する際の信頼性を向上させるため、バリデーションエラーとモデルの以前の出力を再試行時のプロンプトにフィードバックする方法が提案されています。このアプローチは、ランダムな応答を再生成するプロセスを、前回の試行を編集して特定のエラーを自己修正するものへと変えます。

media Hugging Face Forums · 15時間前

報告されたZeroGPUスロット数とリストされたSpacesの不一致

あるユーザーが、ゼロ-a10gハードウェアを要求しているSpacesが8つしかないにもかかわらず、制限10に対して17のZeroGPUスロットが使用中であるというクォータエラーに遭遇しました。

media Hugging Face Forums · 15時間前

AzureでSAM3をデプロイ中にSecretsInjectionErrorが発生

あるユーザーが、Hugging Face Foundryの例を使用してMicrosoft Azure上でMeta SAM3モデルをデプロイしようとした際、SecretsInjectionErrorに遭遇したと報告しています。このエラーは、デプロイされたAPIを呼び出す際のセットアップおよびインストールフェーズ中に発生します。

media Hugging Face Forums · 15時間前

NanoI2V: スクラッチから画像から動画への変換モデルを構築する

NanoI2Vは、スクラッチから画像から動画への生成モデルを実装するオープンソースプロジェクトであり、最新の動画生成技術に対するクリーンで教育的なリファレンスの提供を目指しています。このリポジトリは、ほとんどの最先端プロジェクトに見られる複雑さよりも、可読性と再現性を優先しています。

media Hugging Face Forums · 15時間前

HuggingFaceに私の研究を公開する方法は？

あるユーザーがHugging Faceフォーラムで、自身の研究プロジェクトTIS（トークン重要度スコアリング）および関連するコードとドキュメントを適切に公開する方法についてガイダンスを求めています。

github Goose (Block) · 15時間前

Goose v1.40.0 リリースノート

Goose v1.40.0 アップデートは、デスクトップアプリケーションの包括的なローカライゼーションサポートを導入し、フランス語、ドイツ語、イタリア語、ポルトガル語、インドネシア語、マレー語、ベトナム語、繁体字中国語、韓国語、日本語、スペイン語、ヒンディー語のロケールを追加しました。

media Hugging Face Forums · 18時間前

Context Gravity

Chris Diaz氏は、現在GitHubで公開中の「Context Gravity」という新しいプロジェクトを共有しました。著者はリポジトリに関するコミュニティからのフィードバックを求めています。

media Hugging Face Forums · 20時間前

Show HF: ServBay、コーディングエージェント向けのローカルファーストランタイム＆AIゲートウェイ

ServBayは、AIコーディングエージェントとユーザーのホストマシンの間のギャップを埋めるために設計された、ローカルファーストのランタイムおよびインフラストラクチャソリューションとして紹介されています。これは、インテリジェントなエージェントが手動の開発者介入なしでデータベース、ドメイン、またはSSL証明書を構成するシステムレベルの能力を欠いているという「ラストマイル」の問題に対処します。

media Hugging Face Forums · 20時間前

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

Prism Transformerは、レイヤー間でアテンションヘッドの数を可変にするプログレッシブヘッドスケジュールを導入します。これは、初期レイヤーでは少数で広いヘッドから始め、深さとともに単調に増加させます。このアプローチは、アーキテクチャオーバーヘッドを追加せずに、初期と後期のレイヤーの構造的なニーズの違いに対応することで、標準的な均等割り当てに挑戦します。

github CrewAI · 20時間前

LangChain v1.15.2a2 リリースノート

このリリースでは、Bedrock統合、フローエージェントのドキュメント、ストリーミングナビゲーションの新機能、バグ修正、ドキュメントの改善が含まれます。

media Hugging Face Forums · 22時間前

フラクタル・ドリーミング＋量子インスパイアード・プランニング：DeepSeek Coderを用いた自己組織化型知識発見ツール

著者は、フラクタルパターン生成と量子インスパイアードな重ね合わせを統合し、DeepSeek Coderの知識空間の探索を強化する自己組織化型知識発見ツールを紹介しています。本システムは、成功した創造的経路をメモリではなくキャッシュされたクエリとして保存することで検索軌道を最適化し、ハードウェアの制約に応じてリソース使用量を適応させます。

PrismMLの1ビットBonsai-8BがIBM GraniteをGrammarによるCPUツール呼び出しで上回る

Lemonade SDKがRPG-HaloTales-V1をリリース、ローカルでのマルチメディアロールプレイに対応

NPC間会話用のオープンソースローカルLLM NPCバックエンド

3台のSpark構成に最適なコーディングモデルは？

Hugging FaceのAndi氏がGemma 4 31Bを使用した完全オープンソースの音声パイプラインを実演

Z.aiがCursor、Claude Code、GitHub Copilotに挑戦するZCodeをリリース

Windows XP上のエージェント型AI向けSimpleLLMChat 1.2.5アップデート

あなたのRAGには何が入っているか？

Palantir CEOがクローズドモデルを激しく批判

構造化出力の信頼性を高める安価なトリック：再試行時にバリデーションエラーをフィードバックする

報告されたZeroGPUスロット数とリストされたSpacesの不一致

AzureでSAM3をデプロイ中にSecretsInjectionErrorが発生

NanoI2V: スクラッチから画像から動画への変換モデルを構築する

HuggingFaceに私の研究を公開する方法は？

Goose v1.40.0 リリースノート

Context Gravity

Show HF: ServBay、コーディングエージェント向けのローカルファーストランタイム＆AIゲートウェイ

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

LangChain v1.15.2a2 リリースノート

フラクタル・ドリーミング＋量子インスパイアード・プランニング：DeepSeek Coderを用いた自己組織化型知識発見ツール