すべての記事
media r/LocalLLaMA · 5時間前

構造化出力の信頼性を高める安価なトリック:再試行時にバリデーションエラーをフィードバックする

大規模言語モデルから構造化出力を生成する際の信頼性を向上させるため、バリデーションエラーとモデルの以前の出力を再試行時のプロンプトにフィードバックする方法が提案されています。このアプローチは、ランダムな応答を再生成するプロセスを、前回の試行を編集して特定のエラーを自己修正するものへと変えます。

media Hugging Face Forums · 11時間前

NanoI2V: スクラッチから画像から動画への変換モデルを構築する

NanoI2Vは、スクラッチから画像から動画への生成モデルを実装するオープンソースプロジェクトであり、最新の動画生成技術に対するクリーンで教育的なリファレンスの提供を目指しています。このリポジトリは、ほとんどの最先端プロジェクトに見られる複雑さよりも、可読性と再現性を優先しています。

media Hugging Face Forums · 16時間前

Show HF: ServBay、コーディングエージェント向けのローカルファーストランタイム&AIゲートウェイ

ServBayは、AIコーディングエージェントとユーザーのホストマシンの間のギャップを埋めるために設計された、ローカルファーストのランタイムおよびインフラストラクチャソリューションとして紹介されています。これは、インテリジェントなエージェントが手動の開発者介入なしでデータベース、ドメイン、またはSSL証明書を構成するシステムレベルの能力を欠いているという「ラストマイル」の問題に対処します。

media Hugging Face Forums · 16時間前

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

Prism Transformerは、レイヤー間でアテンションヘッドの数を可変にするプログレッシブヘッドスケジュールを導入します。これは、初期レイヤーでは少数で広いヘッドから始め、深さとともに単調に増加させます。このアプローチは、アーキテクチャオーバーヘッドを追加せずに、初期と後期のレイヤーの構造的なニーズの違いに対応することで、標準的な均等割り当てに挑戦します。

media Hugging Face Forums · 17時間前

フラクタル・ドリーミング+量子インスパイアード・プランニング:DeepSeek Coderを用いた自己組織化型知識発見ツール

著者は、フラクタルパターン生成と量子インスパイアードな重ね合わせを統合し、DeepSeek Coderの知識空間の探索を強化する自己組織化型知識発見ツールを紹介しています。本システムは、成功した創造的経路をメモリではなくキャッシュされたクエリとして保存することで検索軌道を最適化し、ハードウェアの制約に応じてリソース使用量を適応させます。

media Hugging Face Forums · 17時間前

MacBook M5 ProでのローカルLLM - この分野の完全な初心者!

非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。

lab Hugging Face Blog · 19時間前

ScarfBench: エンタープライズJavaフレームワーク移行におけるAIエージェントのベンチマーク

本記事では、エンタープライズJavaアプリケーションを異なるフレーム間で移行する際のAIエージェントのパフォーマンスを評価するために設計されたベンチマークであるScarfBenchを紹介します。 この研究は、フレームワーク移行の複雑さを浮き彫りにし、この分野におけるエージェントの能力を評価するための標準化された評価方法を提案しています。