すべての記事 — korshunov.ai

すべての記事ページ 1 / 8

github llama.cpp · 9日前

Androidビルドにlibandroid-sp依存関係を追加

Androidビルドのドキュメントが更新され、libandroid-spawnへの依存関係が含まれるようになりました。この追加は、指定された環境内でのビルドプロセスをサポートすることを目的としています。

lab OpenAI News · 10日前

サムスンが従業員向けにChatGPTとCodexを導入

サムスン電子は、OpenAIのChatGPT EnterpriseおよびCodexを世界中の従業員に向けて展開しました。この導入は、OpenAIにとってこれまでで最大のエンタープライズAIイニシアチブの一つとなります。

github llama.cpp · 10日前

llama.cpp リリース b9750: 新しい call ステートメントとクロスプラットフォームバイナリ

llama.cpp バージョン b9750 は、call ステートメントの実装を導入し、意図しない変更をロールバックします。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリコンパイル済みバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。

github llama.cpp · 10日前

llama.cpp がバージョン b9748 をリリース、新しいバイナリと機能を追加

llama.cpp はバージョン b9748 をリリースし、スキーマに「verbose」フィールドを追加するとともに、macOS、Linux、Android、Windows、openEuler 用のバイナリを提供しました。本リリースでは、CPU、Vulkan、OpenVINO、SYCL、ROCm のサポートが複数のアーキテクチャで提供され、iOS および Windows 向けの CUDA および Vulkan ビルドも利用可能です。

lab Google DeepMind Blog · 10日前

内部システムセキュリティのためのAI制御ロードマップ

従来の保護策とリアルタイム監視機能を統合することで、内部システムを保護するAI制御ロードマップが導入されました。

lab OpenAI News · 10日前

GPT-5.5 InstantがChatGPTの健康回答を強化

GPT-5.5 Instantは、より強力な推論、改善されたコンテキスト処理、明確なコミュニケーション、医師による評価を通じて、ChatGPTの健康およびウェルネス関連の回答を向上させます。

lab Google — The Keyword (AI) · 10日前

新しい研究により、AMIEが疾患管理において医師と同等の性能を示すことが判明

Natureに掲載された研究によると、対話型AIシステムであるAMIEは、複雑な健康状態の管理において一次医療提供者と同等のパフォーマンスを発揮することが明らかになった。

lab Google DeepMind Blog · 10日前

英国政府とGoogle DeepMindがAI搭載の住宅計画プロトタイプを公開

英国政府は、住宅計画の意思決定を加速させるために設計されたAI搭載のプロトタイプを開発するため、Google DeepMindと提携しました。この取り組みは、人工知能を活用して意思決定の効率性を向上させることで、住宅建設プロセスを合理化することを目指しています。

lab OpenAI News · 10日前

OpenAI、ChatGPT Enterprise向けに支出管理と利用分析機能をリリース

OpenAIは、ChatGPT Enterprise向けの新しい支出管理機能と利用分析機能を導入しました。これらの機能により、企業はAIの利用を拡大する際にコストを管理し、適切な判断を下すことができます。

github llama.cpp · 10日前

llama.cpp リリース b9747 でリアルタイムのモデルロード追跡と新しいプラットフォームバイナリが追加

llama.cpp バージョン b9747 は、SSE エンドポイントを通じてリアルタイムのモデルロード進行状況の追跡を導入しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL などのさまざまなアーキテクチャとアクセラレーション技術に対応しています。

github llama.cpp · 10日前

llama.cpp リリース b9745 が MTP3 サポートとクロスプラットフォームバイナリを追加

llama.cpp バージョン b9745 は、レイヤーオフセットと nextn フラグの新しい API を含む Step3.5/3.7 flash MTP3 のサポートを導入しました。このリリースでは、macOS、Linux、Android、Windows、openEuler 向けのビルド済みバイナリが提供され、CPU、Vulkan、CUDA、OpenVINO、SYCL のアクセラレーションオプションが含まれています。

github llama.cpp · 11日前

LLaMA.cpp b9744 リリース: 新しいバイナリと新機能

LLaMA.cpp がバージョン b9744 をリリースしました。macOS、Linux、Android、Windows、openEuler 用の更新されたバイナリが含まれています。

github llama.cpp · 11日前

llama.cpp リリース b9742: SSM-conv 重み用にパッド済みストライドを更新

llama.cpp バージョン b9742 は、SSM-conv 重みのためにパッド済みストライドを導入し、ニューラルネットワーク演算の効率を向上させます。このリリースには、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャと API に対応した、macOS、Linux、Android、Windows、openEuler 用のバイナリが含まれています。

github llama.cpp · 11日前

llama.cpp リリース b9743 が新しいバイナリと GPU サポートを追加

llama.cpp バージョン b9743 は、macOS、Linux、Android、Windows、openEuler 向けの新しいバイナリを複数のアーキテクチャで導入します。今回のリリースには Vulkan、CUDA 12.4 および 13.3、OpenVINO、SYCL、ROCm のサポートが含まれ、JSON スキーマから文法への整合性により UI が更新され、パーサーのスペースルールが改善されました。

lab Claude Code Releases · 11日前

v2.1.185でStream-Stallヒントが更新されました

stream-stallヒントは「API応答を待機中 · …秒後に再試行」を表示し、20秒間の沈黙後にアクティブ化され、以前のメッセージと遅延に置き換わります。

github llama.cpp · 11日前

llama.cpp リリース b9741 が新しいバイナリとサポートを追加

llama.cpp バージョン b9741 は、macOS、Linux、Android、Windows、openEuler 向けに複数のアーキテクチャに対応した新しいバイナリを導入しました。このリリースには Vulkan、CUDA 12.4 および 13.3、OpenVINO、SYCL、ROCm のサポートが含まれ、iOS と Ubuntu のバージョンも更新されました。

github llama.cpp · 11日前

Windowsにおけるtest-args-parserのランダムな失敗を修正

OpenVINOのWindowsワークフローで発生していたfastfailアサーションを修正しつつ、実際のバイナリに対するUTF-8処理を維持するため、argvのオーバーライドがargcと一致する場合にのみ適用されるように変更し、Windowsにおけるtest-args-parserのランダムな失敗に対処するパッチです。

github llama.cpp · 11日前

LLaMA.cpp リリース b9739 が Win OpenCL Adreno ARM64 サポートを追加

LLaMA.cpp バージョン b9739 は、OpenCL Adreno を使用した Windows ARM64 のサポートを追加しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャと API で利用可能です。

github llama.cpp · 11日前

llama.cpp リリース b9738: CORS 認証ヘッダーの転送修正と新しいバイナリビルド

llama.cpp バージョン b9738 は、認証ヘッダーを転送しないように CORS プロキシを修正しました。このリリースには、macOS、Linux、Android、Windows、openEuler 向けのバイナリビルドが含まれており、Vulkan、CUDA、OpenVINO、SYCL を含む複数のアーキテクチャとハードウェアアクセラレーションオプションに対応しています。

github llama.cpp · 11日前

ggmlがAMXの最適化にパーティション平坦化を採用

ggmlプロジェクトは、n_batch * M に対するパーティションを平坦化することでAMXのパフォーマンスを最適化し、すべてのスレッドが量子化に参加するようにしました。この変更により、CPUおよびGPUプラットフォーム上で様々なモデルやハードウェア構成において最大1.47倍の速度向上を実現し、推論時間の改善が一貫して確認されています。