すべての記事
media Hugging Face Forums · 3日前

Ainara: 永続メモリとLLM切替機能を備えたローカルファーストAIアシスタント

Ainaraはダブリンのデベロッパー向けのローカルファーストデスクトップアプリケーションで、セッション間で永続メモリを持つAIコンパニオンとして機能します。Grok、Claude、GeminiなどのクラウドモデルとローカルのOllamaモデルの間でコンテキストをシームレスに維持しながら切り替えることができます。

github llama.cpp · 3日前

Tailwindスキャン修正とマルチプラットフォームバイナリを含むllama.cpp b9839リリース

llama.cppプロジェクトは、無視されたワークツリーでTailwindスキャンを復元する修正を含むバージョンb9839をリリースしました。このアップデートでは、macOS、Linux、Android、Windows、openEuler向けのプリビルドバイナリが、さまざまなアーキテクチャとハードウェアアクセラレーションバックエンドで提供されています。

github llama.cpp · 3日前

llama.cpp b9838 リリース: macOS、Linux、Windows、Android 向けビルド

llama.cpp プロジェクトはバージョン b9838 をリリースし、幅広いオペレーティングシステムとハードウェアアクセラレータ向けのプリビルドバイナリを提供しました。このリリースでは、macOS、Linux、Windows、Android、openEuler 上で、CPU、GPU(CUDA、Vulkan、ROCm、OpenCL)、および専用 AI アクセラレータのサポートが含まれています。

media Hugging Face Forums · 3日前

世代間コンテキストアーキテクチャ:LLMのコンテキスト劣化を解決する

世代間コンテキストアーキテクチャ(GCA)は、マルチエージェントシステムにおける「コンテキスト劣化」と注意散漫を解決するために、LLMのコンテキストウィンドウを無限のストレージではなく有限の寿命として扱うことを提案しています。人工的な寿命制限を課すことで、パフォーマンスが低下する前にエージェントを終了させ、その状態をフラットファイルのMarkdown vaultを通じて次世代に渡します。

media Hugging Face Forums · 3日前

小規模言語モデル内部の機能レジームを探る

この独立した研究プロジェクトは、標準的な出力ベンチマークに依存するのではなく、推論中に隠れた表現がどのように進化するかを分析することで、7つの小・中規模言語モデルの内部動態を特徴づけます。本研究は、動的挙動、機能的组织化、および表現幾何を調査し、異なるアーキテクチャ間で再現可能なパターンを特定することを目指しています。

media Hugging Face Forums · 3日前

Transformerの包括的なバイリンガルガイド:基礎からKVキャッシュ圧縮とアテンションダイナミクスまで

Carles Marinは、Transformerアーキテクチャの数学的基盤とその実装を結びつける、オープンソースのバイリンガル(英語およびスペイン語)ガイドをリリースしました。このリソースは低レベルのメカニクスに焦点を当て、複雑なトピックを説明するために再現可能なコードとインタラクティブな要素を提供しています。

lab OpenAI News · 3日前

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。