すべての記事 — korshunov.ai

すべての記事ページ 1 / 14

GeneBench-Proの内部：複雑なゲノム推論の10事例研究

GeneBench-Proは、複雑なゲノム推論タスクにおいてモデルを評価するために設計されたベンチマークで、代表的な質問と支援資料を紹介する10の詳細な事例研究を特徴としています。各事例研究では、特定の生物学的課題に対するモデルのパフォーマンスを評価するために必要な元のプロンプト、データセット、およびコンテキストを提供します。

lab OpenAI News · 1日前

GeneBench-Proの紹介

GeneBench-Proは、AIエージェントが計算生物学において曖昧さに対処し、重要な判断を下す能力を測定するために設計された研究レベルのベンチマークであり、元のGeneBenchを拡張したものです。これは、データノイズへの対応、仮定の修正、結果が意思決定に準備できているかどうかの判定といった高次な能力をテストすることで、現在の評価の限界に対処します。

lab OpenAI News · 1日前

コアドンプの疫学：18年前のバグを修正する

OpenAIのエンジニアは、Rocksetデータインフラストラクチャで説明のつかないC++クラッシュが発生した原因として、Azureホストでの静かなハードウェア破損とGNU libunwind内の18年前から存在する競合条件という2つの異なる要因を特定しました。

lab OpenAI News · 1日前

ChatGPTの採用がどのように拡大したか

OpenAI Signalsのデータによると、ChatGPTの採用は世界中で広がり、深まりつつあり、ユーザーは毎日50%多いメッセージを送信し、サインアップから6ヶ月後に試す固有のタスクの数が2倍になっている。

github llama.cpp · 2日前

llama.cpp b9849 リリース: IPv6 URL 処理と新しいバイナリ

llama.cpp b9849 リリースでは、URL のホスト部における角括弧で囲まれた IPv6 リテラルのサポートが導入され、RFC 3986 に準拠して [host]:port 形式をサーバーが解析できるようになりました。この更新により、リッスンログ、プロキシヘッダー、クライアントの再構築の書式が適切に保たれつつ、リクエストごとの追跡のために bare remote_addr が維持されます。

lab Google DeepMind Blog · 2日前

Nano Banana 2 Lite と Gemini Omni Flash で構築を開始

Googleは、インテリジェントなアプリケーションの構築における開発者の能力を強化するために設計された2つの新しいAIモデル、Nano Banana 2 LiteとGemini Omni Flashをリリースしました。

lab Hugging Face Blog · 2日前

なぜ専門化は避けられないのか

記事は、機械学習における専門化がモデルの複雑さの増加とドメイン固有の専門知識の必要性によって駆動される避けられないトレンドであると主張しています。

github llama.cpp · 2日前

llama.cpp b9848 リリースで CUDA の get_rows_back が修正され、バイナリが提供される

llama.cpp プロジェクトはバージョン b9848 をリリースしました。このバージョンには、65535 行を超えるテーブルにおける `get_rows_back` 関数の問題を解決するための CUDA バックエンドの重要な修正が含まれています。このアップデートは、以前に大規模なテーブル操作に影響を与えていた grid-y クランプおよびストライドのエラーを修正します。

lab Hugging Face Blog · 2日前

Hugging Face モデルページに Every Eval の全評価結果を表示

Hugging Face はモデルページを更新し、「Every Eval」イニシアチブからの評価結果を表示し、さまざまなベンチマークにわたるモデルパフォーマンスの包括的なビューを提供します。この統合により、ユーザーはモデルハブインターフェース内で直接広範な標準化されたメトリクスにアクセスできます。

github llama.cpp · 2日前

llama.cpp b9847 リリースでGemma E4B MTP FlashAttentionの修正

llama.cppプロジェクトはバージョンb9847をリリースしました。このリリースには、CUDAにおけるGemma E4B MTP FlashAttentionの修正と、未使用のテンプレート宣言の削除が含まれています。

media Hugging Face Forums · 2日前

チャットボット開発におけるオープンソースLLMに関するコミュニティディスカッション

Hugging Faceフォーラムのディスカッションスレッドでは、ユーザーが現在チャットボット開発に使用している無料またはオープンソースのAIモデルとその選択理由について質問しています。

media Hugging Face Forums · 2日前

私のハードウェアで実行できるトップ5モデルは？AIの脳葉白質切除術なし

Hugging Faceフォーラムのユーザーは、複雑なトピックについて推論可能な検閲のないAIモデルの推奨を求めています。現在の反復版よりもGPT-4の早期バージョンを好むと述べています。

github llama.cpp · 2日前

Asahi Linux向けVulkan行列積最適化を含むllama.cpp b9846リリース

llama.cppプロジェクトは、Asahi Linux向けのVulkanバックエンド最適化を含むバージョンb9846をリリースしました。このアップデートでは、Apple Siliconハードウェア上でLinuxを実行する環境における互換性とパフォーマンスを向上させるため、行列積のブロックサイズループをロールバックしています。

github llama.cpp · 2日前

llama.cpp b9844 リリースで NVFP4 サポートと新しいバイナリが追加

llama.cpp プロジェクトはバージョン b9844 をリリースし、NVFP4 量子化形式に対する ggml-webgpu のサポートを導入しました。このアップデートでは、macOS、iOS、Linux、Android、Windows、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリも提供されています。

lab Google — The Keyword (AI) · 2日前

英国の次の生産性の時代の解き放ち：AIの先駆者たちの国を構築する

Google UKは、国内でより多くの人々がAI搭載技術の恩恵を引き出すための戦略を詳述した最新の経済影響レポートを発表しました。

github llama.cpp · 2日前

macOS、Linux、Windowsバイナリを含むllama.cpp b9843リリース

llama.cppプロジェクトは、b9843リリースを公開しました。これにより、macOS、Linux、Android、Windows、openEulerの各プラットフォーム向けに、さまざまなハードウェアアーキテクチャに対応したビルド済みバイナリが提供されます。

github LangGraph · 2日前

LangGraph 1.2.7 リリースノート

LangGraph バージョン 1.2.7 がリリースされ、LangChain エコシステム向けのバグ修正と依存関係の更新が導入されました。

lab Microsoft Research Blog · 2日前

Memora: 抽象化と具体性のバランスを取る調和型メモリ表現

Microsoft Researchは、長期のAIタスクにおいて抽象化と具体性のバランスを取るために設計されたスケーラブルなエージェント型メモリフレームワークであるMemoraを発表しました。このシステムは、豊富なメモリコンテンツを軽量な検索構造から分離し、ベンチマークで新たな最先端の結果を達成しながら、コンテキストトークンを最大98%削減します。

lab Claude Code Releases · 2日前

Claude Code v2.1.196 リリースノート

Claude Code バージョン 2.1.196 は、組織デフォルトモデル、クリック可能なファイル添付、MCP サーバー承認のセキュリティ強化を導入します。このアップデートは、バックグラウンドセッションの信頼性を向上させ、さまざまなエージェントステータスレポートの問題を修正し、コードレビューワークフローでのトークン使用量を最適化します。

lab Hugging Face Blog · 2日前

DiScoFormer: 分布にわたる密度とスコアのための1つのTransformer

本記事では、さまざまなデータ分布において密度推定とスコアベースの生成タスクの両方を実行できる統合TransformerモデルであるDiScoFormerを紹介します。