すべての記事 — korshunov.ai

すべての記事ページ 1 / 16

UI停止と推論スキップの修正を含むllama.cpp b9835リリース

llama.cppプロジェクトは、シングルモデルモードでの停止および推論スキップ機能の修正を含むバージョンb9835をリリースしました。このアップデートは、モデル推論中の制御を改善するためにユーザーインターフェース内の特定の問題に対処しています。

media Hugging Face Forums · 4日前

AIによるバイナリコード学習に関する仮想的な問い

フォーラムのユーザーは、ニューラルネットワークやAIシステムにバイナリコードを理解させるトレーニングが、特にコーディングタスクにおいて、全体の能力を大幅に向上させるかどうかという推測的な質問をしています。

media Hugging Face Forums · 4日前

コンセプト：AIモデルの学習用データとデータを交換する

あるユーザーが、個人がAIモデルの学習用にデータを交換できるウェブサイトの概念を提案しています。これにより金銭取引が必要なくなります。システムはクレジット経済で動作し、ユーザーは一定量のクレジットから始まり、特定のデータニーズに対してバウンティを投稿します。

github llama.cpp · 4日前

llama.cpp b9833 リリース: MiniCPM5 パーサーとマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9833 をリリースし、MiniCPM5 モデル専用のパーサーをはじめとする各種バグ修正とリファクタリングを導入しました。このアップデートには、ツール呼び出しのパーシング対応、文法の簡略化、Jinja2 基準との互換性を確保するための Jinja API の動作修正が含まれます。

github llama.cpp · 4日前

llama.cpp b9832 リリースで --dump-prog デバッグフラグが追加

llama.cpp プロジェクトはバージョン b9832 をリリースし、Jinja テンプレートエンジン用の新しい `--dump-prog` コマンドラインオプションを導入してデバッグを支援しました。このアップデートには、macOS、Linux、Android、Windows、openEuler 向けに、さまざまな CPU および GPU アーキテクチャに対応した事前ビルド済みバイナリも含まれています。

github llama.cpp · 4日前

llama.cpp b9831 リリースで DFlash サポートと新しいバイナリが追加

llama.cpp の b9831 リリースでは、レイヤータイプごとのスライディングウィンドウアテンションを含む DFlash v2 サポートが導入され、複数のプラットフォーム向けの包括的なビルド済みバイナリセットも提供されています。

github llama.cpp · 4日前

llama.cpp b9830 リリースで --offline フラグが追加され、メモリバグが修正される

llama.cpp b9830 リリースでは、llama download コマンドで --offline フラグを使用できるようになり、ネットワークアクセスなしでキャッシュされたモデルを検証できます。このアップデートはまた、first_path が参照によって誤ってキャプチャされていた URL タスクの on_done コールバックにおける潜在的な use-after-free 脆弱性も修正します。

media Hugging Face Forums · 4日前

ユーザーが zhoucantd のアカウント復旧をリクエスト

Hugging Face フォーラムのユーザーが、特にユーザー名「zhoucantd」を指定して、アカウントの復旧が可能かどうかを尋ねています。この投稿は、このリクエストに関する2人の参加者によるディスカッションスレッドを示しています。

media Hugging Face Forums · 4日前

UCTF: 多言語AIのためのユニバーサル圧縮トレーニングフォーマット

UCTF（Universal Compressed Training Format）と呼ばれる新しい概念は、多言語LLMのトレーニングにおける意味的な冗長性を解決するために、多様な言語を統一された言語非依存のトークン形式に圧縮する仲介層を提案しています。

media Hugging Face Forums · 4日前

Gradio を使用してウェブサイトチャットウィジェットを作成する第4部

あるユーザーは、最近の Gradio アップデート後に CORS ポリシーエラーのため、以前正常に動作していたウェブサイトの AI チャットボットウィジェットが機能しなくなったと報告しています。このエラーは、レスポンス内の 'Access-Control-Allow-Credentials' ヘッダーが空であり、クライアントのリクエスト資格情報モードと競合していることを示しています。

media Hugging Face Forums · 4日前

知性の担い手としての言語：トークン予測を超えて

本記事は、大規模言語モデルがその見かけの知性を、独立した機械的計算や単純なトークン予測ではなく、言語自体の内部にある深い幾何学的関係と隠れた状態から導き出していると主張している。

github llama.cpp · 4日前

llama.cpp b9829 リリース: ログの削減とマルチプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9829 をリリースしました。これには、サーバー、共通コンポーネント、推測的デコーディングモジュールでのログ出力の削減が含まれます。このアップデートでは、CMN_ から COM_ への置換により命名規則が標準化されました。

media Hugging Face Forums · 4日前

新しいML数独データセットプロジェクトの共同開発者を募集中

Hugging Faceフォーラムのユーザーが、数独に焦点を当てた機械学習およびディープラーニングプロジェクトを構築するための共同開発者を募集しています。著者はゼロからデータベースの作成を開始し、この目的のために独立した組織を設立することを目指しています。

github llama.cpp · 4日前

llama.cpp b9828 リリース: OpenCL Flash Attention の改善と新しいバイナリ

llama.cpp b9828 リリースは、f16 および f32 精度の Flash Attention カーネルを再構築するなど、OpenCL の大幅な強化をもたらしました。このアップデートには、新しいプレフィルプリパスカーネルと q4_0 および q8_0 量子化形式のサポートが含まれます。

media Hugging Face Forums · 5日前

異言語アブレーションの経験は？

あるユーザーが、主にラテン語ベースのバージョンを作成するためにモデルからマンダリン、ロシア語、アラビア語をアブレーションする経験について質問しています。目標は、英語にアクティベーションがない文脈において、さらなるトレーニングや安全なプルーニングのためにスペースを空けることです。

github llama.cpp · 5日前

llama.cpp b9827 リリースで CUDA 2D 非同期コピーの最適化が追加

llama.cpp b9827 リリースは、ggml_cuda_cpy 関数に cudaMemcpy2DAsync の高速パスを追加することで、CUDA のパフォーマンス最適化を導入します。この変更により、テンソルが完全に連続していないものの各行が連続している場合の、同じ型・同じ形状のストライド付きコピーを高速化し、従来の要素ごとのスカラーコピーカーネルに代わります。

github llama.cpp · 5日前

llama.cpp b9825 リリース: Vulkan 修正とクロスプラットフォームバイナリ

llama.cpp プロジェクトはバージョン b9825 をリリースしました。このバージョンには、ゼロ入力を処理する際の Vulkan ステップ演算子の修正が含まれています。このアップデートにより、macOS、Linux、Windows、Android、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリが提供されます。

github llama.cpp · 5日前