すべての記事
media Hugging Face Forums · 3日前

世代間コンテキストアーキテクチャ:LLMのコンテキスト劣化を解決する

世代間コンテキストアーキテクチャ(GCA)は、マルチエージェントシステムにおける「コンテキスト劣化」と注意散漫を解決するために、LLMのコンテキストウィンドウを無限のストレージではなく有限の寿命として扱うことを提案しています。人工的な寿命制限を課すことで、パフォーマンスが低下する前にエージェントを終了させ、その状態をフラットファイルのMarkdown vaultを通じて次世代に渡します。

media Hugging Face Forums · 3日前

Transformerの包括的なバイリンガルガイド:基礎からKVキャッシュ圧縮とアテンションダイナミクスまで

Carles Marinは、Transformerアーキテクチャの数学的基盤とその実装を結びつける、オープンソースのバイリンガル(英語およびスペイン語)ガイドをリリースしました。このリソースは低レベルのメカニクスに焦点を当て、複雑なトピックを説明するために再現可能なコードとインタラクティブな要素を提供しています。

lab OpenAI News · 4日前

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。

github llama.cpp · 4日前

llama.cpp b9837 リリースで --reasoning-preserve フラグと新しいバイナリが追加

llama.cpp プロジェクトはバージョン b9837 をリリースし、推論トークンを保持するための Jinja チャットテンプレート用の新しい `--reasoning-preserve` フラグを導入しました。このアップデートではヘルプメッセージの修正に加え、macOS、Linux、Windows、Android、openEuler の各種ハードウェアバックエンド向けにビルド済みバイナリも提供されています。

media Hugging Face Forums · 4日前

HoLo-ToLk: 0パラメータHSL基盤上のトークナイザー不要音声モデル

著者は、トークナイザーや学習済み入力埋め込みを使用せず、0パラメータのHSLバイト基盤を使用して音声からテキスト(STT)およびテキストから音声(TTS)モデルを構築する研究プロジェクトであるHoLo-ToLkを紹介します。この作業は、特定のアーキテクチャ変更と組み合わせることで、生のHSLバイトが音声処理にとって有効な信号となり得ることを示しています。

github llama.cpp · 4日前

llama.cpp b9833 リリース: MiniCPM5 パーサーとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9833 をリリースし、MiniCPM5 モデル専用のパーサーをはじめとする各種バグ修正とリファクタリングを導入しました。このアップデートには、ツール呼び出しのパーシング対応、文法の簡略化、Jinja2 基準との互換性を確保するための Jinja API の動作修正が含まれます。

github llama.cpp · 4日前

llama.cpp b9832 リリースで --dump-prog デバッグフラグが追加

llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。

github llama.cpp · 4日前

llama.cpp b9830 リリースで --offline フラグが追加され、メモリバグが修正される

llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。

media Hugging Face Forums · 4日前

Gradio を使用してウェブサイトチャットウィジェットを作成する 第4部

あるユーザーは、最近の Gradio アップデート後に CORS ポリシーエラーのため、以前正常に動作していたウェブサイトの AI チャットボットウィジェットが機能しなくなったと報告しています。このエラーは、レスポンス内の 'Access-Control-Allow-Credentials' ヘッダーが空であり、クライアントのリクエスト資格情報モードと競合していることを示しています。