すべての記事
media Hugging Face Forums · 15時間前

Prism Transformer: 階層型アテンション処理のためのプログレッシブヘッドスケジュール

Prism Transformerは、レイヤー間でアテンションヘッドの数を可変にするプログレッシブヘッドスケジュールを導入します。これは、初期レイヤーでは少数で広いヘッドから始め、深さとともに単調に増加させます。このアプローチは、アーキテクチャオーバーヘッドを追加せずに、初期と後期のレイヤーの構造的なニーズの違いに対応することで、標準的な均等割り当てに挑戦します。

media Hugging Face Forums · 16時間前

フラクタル・ドリーミング+量子インスパイアード・プランニング:DeepSeek Coderを用いた自己組織化型知識発見ツール

著者は、フラクタルパターン生成と量子インスパイアードな重ね合わせを統合し、DeepSeek Coderの知識空間の探索を強化する自己組織化型知識発見ツールを紹介しています。本システムは、成功した創造的経路をメモリではなくキャッシュされたクエリとして保存することで検索軌道を最適化し、ハードウェアの制約に応じてリソース使用量を適応させます。

media Hugging Face Forums · 16時間前

MacBook M5 ProでのローカルLLM - この分野の完全な初心者!

非プログラマーが、128GBのユニファイドメモリを備えたMacBook M5 Maxでローカル大規模言語モデルインフラストラクチャをセットアップする経験を共有しています。ユーザーは、学習用のソフトウェアスタック、モデル選択、安定してリモートアクセス可能なシステムを構築しながらAIを学ぶための目標について詳しく説明しています。

lab Hugging Face Blog · 18時間前

ScarfBench: エンタープライズJavaフレームワーク移行におけるAIエージェントのベンチマーク

本記事では、エンタープライズJavaアプリケーションを異なるフレーム間で移行する際のAIエージェントのパフォーマンスを評価するために設計されたベンチマークであるScarfBenchを紹介します。 この研究は、フレームワーク移行の複雑さを浮き彫りにし、この分野におけるエージェントの能力を評価するための標準化された評価方法を提案しています。

github llama.cpp · 23時間前

llama.cpp b9859 リリースで OpenCL プリコンパイル済みカーネルサポートが追加

llama.cpp の b9859 リリースは、OpenCL 用のプリコンパイル済みバイナリカーネルをライブラリからロードする機能を導入し、特に Adreno GPU を対象としています。このアップデートでは、CPU、GPU、および各種アクセラレータバックエンドに対して、macOS、Linux、Windows、Android、openEuler のバイナリも提供されます。

lab xAI News · 1日前

xAI、Grok Voice向けノーコード音声エージェントビルダーをリリース

xAIは、Grok Voice上で2分以内に本番環境対応の音声エージェントを設定できるノーコードプラットフォーム「Voice Agent Builder」のベータ版を公開した。このツールにより、運用担当者や開発者は、基礎となるテレフォニーやAIスタックを一から構築することなく、高ボリュームの音声エージェントを展開できる。

github llama.cpp · 1日前

llama.cpp b9857 リリース: Flash Attention の再構築と新バイナリ

llama.cpp b9857 リリースは、Hexagon Flash Attention 実装の包括的な再構築を導入し、最適化と精度の向上に重点を置いています。このアップデートには、hex-mm および hex-fa モジュールへの変更が含まれており、例えば量子化タスクをメインの行列乗算スレッドに統合したり、ADD 操作と融合させたり、マスク処理を最適化したりしています。