すべての記事 — korshunov.ai

すべての記事ページ 1 / 24

追跡レポート: DeepSeek V4 Flashを2枚のRTX PRO 6000で実行すると、SonnetやOpusよりもリアルなコーディングタスクが高速に完了し、品質はSonnetレベルに達する

DeepSeek V4 FlashをvLLMを用いて2枚のRTX PRO 6000 GPU上で動作させた追跡ベンチマークは、Claude SonnetやOpusなどのAPIベースモデルと比較して、現実的なコーディングタスクでのパフォーマンスを評価したものである。その結果、OpusとFableは優れたコード品質を維持しているものの、DeepSeek V4 FlashはSonnetレベルの品質を達成しつつ、大幅に短い実時間で処理を終了することが判明した。

media r/LocalLLaMA · 5時間前

ローカルノードのマッピング - Mildlyinteresting

著者は、特定のコンテキストにおける活性化パスに基づいてローカルモデルをマッピングおよび制御する観察結果を共有しています。この投稿は、一連のバッチプロンプトに応答する際に、異なるモデル間で活性化パスにばらつきがあることを強調しています。

media r/LocalLLaMA · 5時間前

デュアルRTX 3090でP2Pモードを有効化; 前後の数値 (Qwen3.6-27B INT4、256kコンテキスト)

あるユーザーが、PCIe 4.0 8x/8xリンクを持つデュアルNVIDIA RTX 3090環境でPeer-to-Peer (P2P) モードを有効化することの影響をテストしました。ベンチマークには、Qwen3.6-27B INT4モデル（256kコンテキストウィンドウ）に対してnvbandwidthの5パスと標準的なデコード/ソークテストスクリプトの実行が含まれます。

media r/LocalLLaMA · 5時間前

Palantir HF Orgにはオープンソースモデルやデータセットがゼロ

Redditの投稿により、Hugging Face上のPalantirの組織は現在、オープンソースモデルと公開データセットの両方がゼロであることが強調されています。この観察はclem 🤗によってXで共有され、プラットフォーム上の企業の存在にもかかわらず貢献の欠如が指摘されました。

github llama.cpp · 6時間前

cpp-httplibのアップデートを含むllama.cpp b9861リリース

llama.cppプロジェクトは、cpp-httplib 0.49.0へのベンダー更新を含むバージョンb9861をリリースしました。

github llama.cpp · 7時間前

llama.cpp b9862 リリース: CUDA最適化とマルチプラットフォームバイナリ

llama.cppプロジェクトはバージョンb9862をリリースしました。これはgated_delta_net演算のパフォーマンス最適化と、macOS、Linux、Windows、Android、openEuler向けのビルド済みバイナリを提供します。

github llama.cpp · 7時間前

llama.cpp b9864 リリース: SSE ping インターバルの個別リクエスト設定とプラットフォームバイナリ

llama.cpp b9864 リリースでは、サーバーの Server-Sent Events (SSE) 処理に変更が加えられ、ping インターバルをリクエストごとに構成できるようになりました。この更新により、低速な prefill 操作でも健全な接続が切断されず、サイレントストリームには毎秒 ping が送信され、3 秒後にのみ切断されます。

media r/LocalLLaMA · 7時間前

4台のDGX SparkでのGLM-5.2 NVFP4 — MTPの謎は解決、128Kコンテキストで~24 tok/s

4台のDGX SparkノードでGLM-5.2 NVFP4を実行するフォローアップ調査により、128Kコンテキストで高い受容率が不可能だった以前の性能ボトルネックが解消されました。

media r/LocalLLaMA · 8時間前

ANTHROPIC_BASE_URLが設定されるとClaude Codeがメカニズムを起動

研究者は、ユーザーがローカルモデルに通常使用される環境変数ANTHROPIC_BASE_URLを設定した際に作動するClaude Codeのメカニズムを特定しました。このプロセスには、ソフトウェアのコード内に埋め込まれた不審なホスト名のリストのデコードと復号が含まれます。

media r/LocalLLaMA · 8時間前

DeepSeekが再び巨大なブレークスルー「DSpark」を発表。MTPより遥かに高速 [解説動画]

Redditのユーザーが、MTPよりも大幅に高速であるとされる新しいDeepSeekのブレークスルーであるDSparkに関する動画リンクを共有しました。

media Hugging Face Forums · 8時間前

Hugging Face Spaceが虐待としてフラグされた件のレビューをユーザーが要求

Bitguy07というユーザーは、自分のHugging Face Space「Bitguy07/browser-automation-studio」が、ビルドが成功するたびに自動的に一時停止し、虐待行為としてフラグされると報告しています。ランタイムAPIは「PAUSED」というステージと、「Flagged as abusive（虐待としてフラグ）」というエラーメッセージを返し、コンテナの起動を防いでいます。

media Hugging Face Forums · 8時間前

統一自己組織化フレームワークのドメイン横断的検証

複雑系における自己組織化のための統一された数学的枠組みが、量子デコヒーレンスと古典的なボース・アインシュタイン凝縮体の遷移という2つの独立した物理領域から実験的支援を受けている。本研究は、非局所結合が「臨界増幅器」として作用し、系が最も敏感な位相境界で最大効果を生み出すことを報告している。

media Hugging Face Forums · 9時間前

AGIの問題：知性は錨模倣ではない

この記事は、現在のAIシステムが還元主義に根ざした根本的な「カテゴリエラー」に苦しんでおり、真の人工一般知能（AGI）の達成を妨げていると主張している。それは、洗練された錨模倣では、シミュレートされた応答と本当の理解の間のギャップを埋めることができないと論じている。

media Hugging Face Forums · 9時間前

Octopus SmartがAI搭載のワールドカップ分析システムを構築

Octopus Smartは、ワールドカップやプロフェッショナルなトーナメント向けの分析プラットフォーム「Octopus Football」を開発中であり、これはAI搭載のマッチインテリジェンスオーケストレーションを利用しています。このシステムは予測分析モデルとデータインテリジェンスエージェントを組み合わせ、チームパフォーマンスモデリング、選手評価、自動マッチ要約を提供します。

arxiv arXiv cs.CL · 9時間前

多言語環境におけるLLM-as-a-Judgeの課題と推奨事項

本記事は、多言語および低資源言語の文脈において大規模言語モデルを評価者として使用することの信頼性を検証し、現在の慣行における重要なギャップを浮き彫りにします。著者は650件のACL Anthology論文を分析し、不整合や単一のjudgeモデルへの過度な依存を特定しました。

arxiv arXiv cs.CL · 10時間前

AgenticSTS: 長期ホライズンLLMエージェントのための制限付きメモリテストベッド

著者は、明示的な記憶層が長期ホライズンLLMエージェントの意思決定にどのように影響するかを研究するために設計されたテストベッドであるAgenticSTSを紹介します。これは、Slay the Spire 2というゲームにおいて、生の転写文書を追加するのではなく、型付き検索によってプロンプトを組み立てる制限付きメモリ契約を利用しています。

arxiv arXiv cs.CL · 10時間前

BamiBERT: ベトナム語用の新しいBERTベース言語モデル

研究者らは、BamiBERTを提唱しました。これは現在の標準であるPhoBERTの制限に対処するために設計された、ベトナム語向けの新しいBERTベースの事前学習済み言語モデルです。129GBのコーパスで20エポックからスクラッチでトレーニングされ、最大2048トークンの拡張コンテキスト長をサポートし、外部の単語分割なしで生の入力を直接処理します。

arxiv arXiv cs.CL · 10時間前

CheckRLM: 検索拡張推論における知識-思考の一貫性チェックの有効性

著者は、推論中に事実上の誤りをタイムリーにチェックして修正することで、推論言語モデルの信頼性を向上させるフレームワークであるCheckRLMを提案する。このアプローチは、推論チェーンから事実上の主張を抽出して矛盾を特定し、外部知識を用いて最小限のコストで修正を適用する。

arxiv arXiv cs.CL · 10時間前

HERMES: プレトレーニングデータミキチャーのための多粒度ラベリング基盤

HERMESは、学習されたセマンティック変換と3段階の残差ベクトル量子化を用いて、文書を最大約130kのセルを持つ粗から細へのコードに注釈付けるデータ由来のラベリング基盤です。

arxiv arXiv cs.CL · 10時間前

構造的汎化における方向性の役割について

本記事は、修飾語位置のシフトのような構造的汎化タスクにおける方向性の区別をより適切に処理するためにCCG有向型を利用するAM-Parserのリデザインされた記号的バックエンドを紹介している。