すべての記事 — korshunov.ai

すべての記事ページ 1 / 20

NPC間会話用のオープンソースローカルLLM NPCバックエンド

著者は、クラウド依存なしでNPC間の直接対話を可能にする大規模言語モデル（LLM）NPC向けに設計された、完全にローカルの音声から音声へのバックエンドを公開しました。このシステムは、音声からテキストへの変換、ローカルLLM、およびテキストから音声への変換コンポーネントを統合し、NPC同士が対話したり、文脈を保持したり、将来のプレイヤーとの相互作用に影響を与えたりできるようにします。

media r/LocalLLaMA · 8時間前

Hugging FaceのAndi氏がGemma 4 31Bを使用した完全オープンソースの音声パイプラインを実演

Hugging FaceのAndi氏は、音声対話パイプラインを構築する完全オープンソースで無料のデモを公開しました。このシステムは、Nvidiaのparakeet、Cerebrasによって提供されるGemma 4 31Bモデル、およびQwen3TTSのカスタム推論を組み合わせています。

media r/LocalLLaMA · 8時間前

Z.aiがCursor、Claude Code、GitHub Copilotに挑戦するZCodeをリリース

Z.aiは、Cursor、Claude Code、GitHub Copilotのような確立されたプラットフォームと競争するために設計された新しいAIコーディングツールであるZCodeを導入しました。

media r/LocalLLaMA · 8時間前

Windows XP上のエージェント型AI向けSimpleLLMChat 1.2.5アップデート

開発者は、Windows XPと.NET 4.0を使用してレガシーマシンで実行するように設計されたエージェント型AIハネスであるSimpleLLMChatのバージョン1.2.5をリリースしました。

media r/LocalLLaMA · 8時間前

あなたのRAGには何が入っているか？

あるRedditユーザーが、コーディング、システム管理作業、小規模なコードベースを扱う個人プロジェクトにおける、検索拡張生成（RAG）の実用的な有用性について疑問を呈しています。著者は、標準的な業界知識はすでにモデルによって十分にカバーされていると主張し、コードベースやAPIリファレンスなどの特定のデータソースは、インデックス作成が必要になるほど大きくないか、効率的に管理するには大きすぎる場合があると述べています。

media r/LocalLLaMA · 8時間前

Palantir CEOがクローズドモデルを激しく批判

PalantirのCEO、アレックス・カープは、AnthropicとOpenAIが顧客への過剰課金とデータの不正利用を行ったとして公に非難した。この立場は、Palantirが最近、エンタープライズクライアント向けにローカルモデルを実行するためにNvidiaのチップを購入する契約を結んだことを受けてのものである。

media r/LocalLLaMA · 8時間前

構造化出力の信頼性を高める安価なトリック：再試行時にバリデーションエラーをフィードバックする

大規模言語モデルから構造化出力を生成する際の信頼性を向上させるため、バリデーションエラーとモデルの以前の出力を再試行時のプロンプトにフィードバックする方法が提案されています。このアプローチは、ランダムな応答を再生成するプロセスを、前回の試行を編集して特定のエラーを自己修正するものへと変えます。

media Hugging Face Forums · 13時間前

報告されたZeroGPUスロット数とリストされたSpacesの不一致

あるユーザーが、ゼロ-a10gハードウェアを要求しているSpacesが8つしかないにもかかわらず、制限10に対して17のZeroGPUスロットが使用中であるというクォータエラーに遭遇しました。

media Hugging Face Forums · 13時間前

AzureでSAM3をデプロイ中にSecretsInjectionErrorが発生

あるユーザーが、Hugging Face Foundryの例を使用してMicrosoft Azure上でMeta SAM3モデルをデプロイしようとした際、SecretsInjectionErrorに遭遇したと報告しています。このエラーは、デプロイされたAPIを呼び出す際のセットアップおよびインストールフェーズ中に発生します。

media Hugging Face Forums · 13時間前

NanoI2V: スクラッチから画像から動画への変換モデルを構築する

NanoI2Vは、スクラッチから画像から動画への生成モデルを実装するオープンソースプロジェクトであり、最新の動画生成技術に対するクリーンで教育的なリファレンスの提供を目指しています。このリポジトリは、ほとんどの最先端プロジェクトに見られる複雑さよりも、可読性と再現性を優先しています。

media Hugging Face Forums · 13時間前

HuggingFaceに私の研究を公開する方法は？

あるユーザーがHugging Faceフォーラムで、自身の研究プロジェクトTIS（トークン重要度スコアリング）および関連するコードとドキュメントを適切に公開する方法についてガイダンスを求めています。

github Goose (Block) · 13時間前

Goose v1.40.0 リリースノート

Goose v1.40.0 アップデートは、デスクトップアプリケーションの包括的なローカライゼーションサポートを導入し、フランス語、ドイツ語、イタリア語、ポルトガル語、インドネシア語、マレー語、ベトナム語、繁体字中国語、韓国語、日本語、スペイン語、ヒンディー語のロケールを追加しました。

media Hugging Face Forums · 17時間前

Context Gravity

Chris Diaz氏は、現在GitHubで公開中の「Context Gravity」という新しいプロジェクトを共有しました。著者はリポジトリに関するコミュニティからのフィードバックを求めています。

media Hugging Face Forums · 19時間前

Show HF: ServBay、コーディングエージェント向けのローカルファーストランタイム＆AIゲートウェイ

ServBayは、AIコーディングエージェントとユーザーのホストマシンの間のギャップを埋めるために設計された、ローカルファーストのランタイムおよびインフラストラクチャソリューションとして紹介されています。これは、インテリジェントなエージェントが手動の開発者介入なしでデータベース、ドメイン、またはSSL証明書を構成するシステムレベルの能力を欠いているという「ラストマイル」の問題に対処します。

media Hugging Face Forums · 19時間前

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

Prism Transformerは、レイヤー間でアテンションヘッドの数を可変にするプログレッシブヘッドスケジュールを導入します。これは、初期レイヤーでは少数で広いヘッドから始め、深さとともに単調に増加させます。このアプローチは、アーキテクチャオーバーヘッドを追加せずに、初期と後期のレイヤーの構造的なニーズの違いに対応することで、標準的な均等割り当てに挑戦します。

github CrewAI · 19時間前

LangChain v1.15.2a2 リリースノート

このリリースでは、Bedrock統合、フローエージェントのドキュメント、ストリーミングナビゲーションの新機能、バグ修正、ドキュメントの改善が含まれます。

media Hugging Face Forums · 20時間前

フラクタル・ドリーミング＋量子インスパイアード・プランニング：DeepSeek Coderを用いた自己組織化型知識発見ツール

著者は、フラクタルパターン生成と量子インスパイアードな重ね合わせを統合し、DeepSeek Coderの知識空間の探索を強化する自己組織化型知識発見ツールを紹介しています。本システムは、成功した創造的経路をメモリではなくキャッシュされたクエリとして保存することで検索軌道を最適化し、ハードウェアの制約に応じてリソース使用量を適応させます。

media Hugging Face Forums · 20時間前

Wmf - 新しい実験的手法

記事の内容は著者によって削除され、この手法に関する実質的な情報は残されていません。

media Hugging Face Forums · 20時間前

MacBook M5 ProでのローカルLLM - この分野の完全な初心者！

非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。

media Together AI Blog · 21時間前

ICML 2026におけるTogether AI: フルスタックにわたるフロンティア研究

Together AIは、プラットフォーム開発のフルスタックをカバーする9つの論文をICML 2026で発表します。