すべての記事
github llama.cpp · 4日前

llama.cpp b9833 リリース: MiniCPM5 パーサーとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9833 をリリースし、MiniCPM5 モデル専用のパーサーをはじめとする各種バグ修正とリファクタリングを導入しました。このアップデートには、ツール呼び出しのパーシング対応、文法の簡略化、Jinja2 基準との互換性を確保するための Jinja API の動作修正が含まれます。

github llama.cpp · 4日前

llama.cpp b9832 リリースで --dump-prog デバッグフラグが追加

llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。

github llama.cpp · 4日前

llama.cpp b9830 リリースで --offline フラグが追加され、メモリバグが修正される

llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。

media Hugging Face Forums · 4日前

Gradio を使用してウェブサイトチャットウィジェットを作成する 第4部

あるユーザーは、最近の Gradio アップデート後に CORS ポリシーエラーのため、以前正常に動作していたウェブサイトの AI チャットボットウィジェットが機能しなくなったと報告しています。このエラーは、レスポンス内の 'Access-Control-Allow-Credentials' ヘッダーが空であり、クライアントのリクエスト資格情報モードと競合していることを示しています。

media Hugging Face Forums · 5日前

異言語アブレーションの経験は?

あるユーザーが、主にラテン語ベースのバージョンを作成するためにモデルからマンダリン、ロシア語、アラビア語をアブレーションする経験について質問しています。目標は、英語にアクティベーションがない文脈において、さらなるトレーニングや安全なプルーニングのためにスペースを空けることです。

github llama.cpp · 5日前

llama.cpp b9827 リリースで CUDA 2D 非同期コピーの最適化が追加

llama.cpp b9827 リリースは、ggml_cuda_cpy 関数に cudaMemcpy2DAsync の高速パスを追加することで、CUDA のパフォーマンス最適化を導入します。この変更により、テンソルが完全に連続していないものの各行が連続している場合の、同じ型・同じ形状のストライド付きコピーを高速化し、従来の要素ごとのスカラーコピーカーネルに代わります。

github llama.cpp · 5日前

llama.cpp b9825 リリース: Vulkan 修正とクロスプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9825 をリリースしました。このバージョンには、ゼロ入力を処理する際の Vulkan ステップ演算子の修正が含まれています。このアップデートにより、macOS、Linux、Windows、Android、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリが提供されます。

github llama.cpp · 5日前

SYCLのノーマライゼーション修正を含むllama.cpp b9826リリース

llama.cppプロジェクトは、SYCLにおけるノーマライゼーション関数に関連するユニットテストケースの失敗を修正したb9826リリースを発表しました。このアップデートでは、複数のプラットフォームとハードウェアアクセラレータにわたってビルド済みバイナリとフレームワークが提供されます。

media Hugging Face Forums · 5日前

あなたが書くチェックリストがAIを停止させる

この記事は、AIエージェントが不完全な指示に基づいて行動し、欠落した情報を推測することで問題を引き起こすことを指摘しています。この問題は「実行前確認失敗」と呼ばれています。記事では、アクションを実行する前に既知と未知の情報を検証することを要求するランタイム強制構造を提案しています。