すべての記事 — korshunov.ai

すべての記事ページ 1 / 2

科学者向けのAIワークベンチ「Claude Science」が利用可能に

Anthropicは、断片化された科学ツールを単一の研究環境に統合するために設計されたAIワークベンチであるClaude Scienceのベータ版をリリースしました。このプラットフォームは、監査可能な成果物、柔軟なコンピューティングスケーリング、ゲノミクスや構造生物学などの分野向けの専門エージェントを提供することで、発見を加速することを目指しています。

lab Anthropic News · 5時間前

Claude Sonnet 5 の発表

Anthropic は、Claude Sonnet 5 をリリースしました。これは、以前の Opus クラスのモデルよりも低コストで、複雑な計画策定、ツール使用、自律的なコーディングタスクを実行するために設計された新しいエージェント型 AI モデルです。このアップデートは、Opus 4.8 とのパフォーマンス格差を縮めると同時に、その前身である Sonnet 4.6 と比較して、推論、安全性、実行において大幅な改善をもたらしました。

lab OpenAI News · 5時間前

GeneBench-Proの内部：複雑なゲノム推論の10事例研究

GeneBench-Proは、複雑なゲノム推論タスクにおいてモデルを評価するために設計されたベンチマークで、代表的な質問と支援資料を紹介する10の詳細な事例研究を特徴としています。各事例研究では、特定の生物学的課題に対するモデルのパフォーマンスを評価するために必要な元のプロンプト、データセット、およびコンテキストを提供します。

lab OpenAI News · 5時間前

GeneBench-Proの紹介

GeneBench-Proは、AIエージェントが計算生物学において曖昧さに対処し、重要な判断を下す能力を測定するために設計された研究レベルのベンチマークであり、元のGeneBenchを拡張したものです。これは、データノイズへの対応、仮定の修正、結果が意思決定に準備できているかどうかの判定といった高次な能力をテストすることで、現在の評価の限界に対処します。

lab OpenAI News · 5時間前

コアドンプの疫学：18年前のバグを修正する

OpenAIのエンジニアは、Rocksetデータインフラストラクチャで説明のつかないC++クラッシュが発生した原因として、Azureホストでの静かなハードウェア破損とGNU libunwind内の18年前から存在する競合条件という2つの異なる要因を特定しました。

lab OpenAI News · 6時間前

ChatGPTの採用がどのように拡大したか

OpenAI Signalsのデータによると、ChatGPTの採用は世界中で広がり、深まりつつあり、ユーザーは毎日50%多いメッセージを送信し、サインアップから6ヶ月後に試す固有のタスクの数が2倍になっている。

lab Google DeepMind Blog · 7時間前

Nano Banana 2 Lite と Gemini Omni Flash で構築を開始

Googleは、インテリジェントなアプリケーションの構築における開発者の能力を強化するために設計された2つの新しいAIモデル、Nano Banana 2 LiteとGemini Omni Flashをリリースしました。

lab Meta AI / FAIR Blog · 1日前

Brain2Qwerty v2が非侵襲的な脳からテキストへの変換で61%の単語精度を達成

研究者らは、外科的インプラントなしで磁気脳波（MEG）記録からリアルタイムの文章を解読する非侵襲型AIパイプラインであるBrain2Qwerty v2を公開した。このシステムは全体として61%の単語精度を達成し、上位層では78%に達し、以前の非侵襲的手法を大幅に上回っている。

lab OpenAI News · 2日前

ヨーロッパのAI労働力機会をマッピングする

OpenAI Economic Researchは、ESCO分類とEurostatデータを活用し、AIの能力が加盟国全体の労働市場をどのように再構築するかを分析するために、AI雇用移行フレームワークを欧州連合に拡張しました。

lab OpenAI News · 2日前

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。

lab OpenAI News · 4日前

OpenAIがGPT-5.6 Sol、Terra、Lunaモデルをプレビュー

OpenAIはGPT-5.6シリーズの限定プレビューを開始し、フラッグシップのSol、バランスの取れた日常業務用のTerra、高速で低コストなタスク用のLunaという3つの新モデルを導入した。同社は、信頼できるパートナーとの初期フェーズを経て、数週間以内にこれらのモデルを一般公開する計画である。

lab OpenAI News · 6日前

OpenAIの研究、AIエージェントが仕事を変革していることを示す

OpenAIからの新しい研究論文は、人工知能エージェントが仕事の性質を根本的にどのように変えているかを示しています。この研究は、これらのエージェントが以前よりも長く、より複雑なタスクを実行する能力に焦点を当てています。この技術的進歩は、幅広い職業役割全体で生産性を拡大したと評価されています。調査結果は、自動化を通じて労働の組織化と実行方法に大きな変化が生じることを示唆しています。AIエージェントが複雑なワークフローを処理することで、ユーザーはより高い効率を達成できるようになっています。論文は、自律型システムが現代の雇用にもたらす影響が増大していることの証拠となっています。

lab Google DeepMind Blog · 6日前

科学者向けのAIワークベンチ「Claude Science」が利用可能に

Claude Sonnet 5 の発表

GeneBench-Proの内部：複雑なゲノム推論の10事例研究

GeneBench-Proの紹介

コアドンプの疫学：18年前のバグを修正する

ChatGPTの採用がどのように拡大したか

Nano Banana 2 Lite と Gemini Omni Flash で構築を開始

Brain2Qwerty v2が非侵襲的な脳からテキストへの変換で61%の単語精度を達成

ヨーロッパのAI労働力機会をマッピングする

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

OpenAIがGPT-5.6 Sol、Terra、Lunaモデルをプレビュー

OpenAIの研究、AIエージェントが仕事を変革していることを示す

Gemini 3.5 Flashがコンピュータ操作機能を追加

エンタープライズセキュリティとアクセスのための新しいコネクタ制御

OpenAIとBroadcomがLLM最適化推論チップを発表

OpenAI、Appia財団を通じて共有AI基準を構築

Slackチーム向けClaude Tagの発表

GPT-5 Proが3年前の免疫学の謎を解明

MistralがOCR 4をリリース、多言語サポートと構造化出力に対応

OmioがAIネイティブな会話型旅行サービスを開発