すべての記事
media r/LocalLLaMA · 7時間前

NPC間会話用のオープンソースローカルLLM NPCバックエンド

著者は、クラウド依存なしでNPC間の直接対話を可能にする大規模言語モデル(LLM)NPC向けに設計された、完全にローカルの音声から音声へのバックエンドを公開しました。このシステムは、音声からテキストへの変換、ローカルLLM、およびテキストから音声への変換コンポーネントを統合し、NPC同士が対話したり、文脈を保持したり、将来のプレイヤーとの相互作用に影響を与えたりできるようにします。

media r/LocalLLaMA · 8時間前

あなたのRAGには何が入っているか?

あるRedditユーザーが、コーディング、システム管理作業、小規模なコードベースを扱う個人プロジェクトにおける、検索拡張生成(RAG)の実用的な有用性について疑問を呈しています。著者は、標準的な業界知識はすでにモデルによって十分にカバーされていると主張し、コードベースやAPIリファレンスなどの特定のデータソースは、インデックス作成が必要になるほど大きくないか、効率的に管理するには大きすぎる場合があると述べています。

media r/LocalLLaMA · 8時間前

構造化出力の信頼性を高める安価なトリック:再試行時にバリデーションエラーをフィードバックする

大規模言語モデルから構造化出力を生成する際の信頼性を向上させるため、バリデーションエラーとモデルの以前の出力を再試行時のプロンプトにフィードバックする方法が提案されています。このアプローチは、ランダムな応答を再生成するプロセスを、前回の試行を編集して特定のエラーを自己修正するものへと変えます。

media Hugging Face Forums · 13時間前

NanoI2V: スクラッチから画像から動画への変換モデルを構築する

NanoI2Vは、スクラッチから画像から動画への生成モデルを実装するオープンソースプロジェクトであり、最新の動画生成技術に対するクリーンで教育的なリファレンスの提供を目指しています。このリポジトリは、ほとんどの最先端プロジェクトに見られる複雑さよりも、可読性と再現性を優先しています。

media Hugging Face Forums · 19時間前

Show HF: ServBay、コーディングエージェント向けのローカルファーストランタイム&AIゲートウェイ

ServBayは、AIコーディングエージェントとユーザーのホストマシンの間のギャップを埋めるために設計された、ローカルファーストのランタイムおよびインフラストラクチャソリューションとして紹介されています。これは、インテリジェントなエージェントが手動の開発者介入なしでデータベース、ドメイン、またはSSL証明書を構成するシステムレベルの能力を欠いているという「ラストマイル」の問題に対処します。

media Hugging Face Forums · 19時間前

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

Prism Transformerは、レイヤー間でアテンションヘッドの数を可変にするプログレッシブヘッドスケジュールを導入します。これは、初期レイヤーでは少数で広いヘッドから始め、深さとともに単調に増加させます。このアプローチは、アーキテクチャオーバーヘッドを追加せずに、初期と後期のレイヤーの構造的なニーズの違いに対応することで、標準的な均等割り当てに挑戦します。

media Hugging Face Forums · 20時間前

フラクタル・ドリーミング+量子インスパイアード・プランニング:DeepSeek Coderを用いた自己組織化型知識発見ツール

著者は、フラクタルパターン生成と量子インスパイアードな重ね合わせを統合し、DeepSeek Coderの知識空間の探索を強化する自己組織化型知識発見ツールを紹介しています。本システムは、成功した創造的経路をメモリではなくキャッシュされたクエリとして保存することで検索軌道を最適化し、ハードウェアの制約に応じてリソース使用量を適応させます。

media Hugging Face Forums · 20時間前

MacBook M5 ProでのローカルLLM - この分野の完全な初心者!

非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。