すべての記事
lab Anthropic News · 3時間前

科学者向けのAIワークベンチ「Claude Science」が利用可能に

Anthropicは、断片化された科学ツールを単一の研究環境に統合するために設計されたAIワークベンチであるClaude Scienceのベータ版をリリースしました。このプラットフォームは、監査可能な成果物、柔軟なコンピューティングスケーリング、ゲノミクスや構造生物学などの分野向けの専門エージェントを提供することで、発見を加速することを目指しています。

lab Anthropic News · 5時間前

Claude Sonnet 5 の発表

Anthropic は、Claude Sonnet 5 をリリースしました。これは、以前の Opus クラスのモデルよりも低コストで、複雑な計画策定、ツール使用、自律的なコーディングタスクを実行するために設計された新しいエージェント型 AI モデルです。このアップデートは、Opus 4.8 とのパフォーマンス格差を縮めると同時に、その前身である Sonnet 4.6 と比較して、推論、安全性、実行において大幅な改善をもたらしました。

lab OpenAI News · 5時間前

GeneBench-Proの内部:複雑なゲノム推論の10事例研究

GeneBench-Proは、複雑なゲノム推論タスクにおいてモデルを評価するために設計されたベンチマークで、代表的な質問と支援資料を紹介する10の詳細な事例研究を特徴としています。各事例研究では、特定の生物学的課題に対するモデルのパフォーマンスを評価するために必要な元のプロンプト、データセット、およびコンテキストを提供します。

lab OpenAI News · 5時間前

GeneBench-Proの紹介

GeneBench-Proは、AIエージェントが計算生物学において曖昧さに対処し、重要な判断を下す能力を測定するために設計された研究レベルのベンチマークであり、元のGeneBenchを拡張したものです。これは、データノイズへの対応、仮定の修正、結果が意思決定に準備できているかどうかの判定といった高次な能力をテストすることで、現在の評価の限界に対処します。

lab OpenAI News · 2日前

HP Inc.、OpenAIとフロンティア戦略的パートナーシップを開始

HP Inc.は、成功したパイロット運用を経て、OpenAIとの戦略的パートナーシップを拡大し、顧客体験、従業員の生産性、ソフトウェア開発の各領域にAIを展開しています。同社は、実験的なユースケースから企業全体の生産環境への移行に伴い、コンテキスト、権限、評価を管理するための統一されたオペレーティングモデルとして、OpenAIフロンティアプラットフォームを活用しています。

lab OpenAI News · 6日前

OpenAIの研究、AIエージェントが仕事を変革していることを示す

OpenAIからの新しい研究論文は、人工知能エージェントが仕事の性質を根本的にどのように変えているかを示しています。この研究は、これらのエージェントが以前よりも長く、より複雑なタスクを実行する能力に焦点を当てています。この技術的進歩は、幅広い職業役割全体で生産性を拡大したと評価されています。調査結果は、自動化を通じて労働の組織化と実行方法に大きな変化が生じることを示唆しています。AIエージェントが複雑なワークフローを処理することで、ユーザーはより高い効率を達成できるようになっています。論文は、自律型システムが現代の雇用にもたらす影響が増大していることの証拠となっています。

lab Mistral AI News · 6日前

エンタープライズセキュリティとアクセスのための新しいコネクタ制御

Mistral Studioは、ワークスペースおよびツールごとにコネクタアクセスを管理するための強化された管理者制御を提供します。これにより、きめ細かい権限付与が可能になります。機能には、スコープ付きAPIキー、マルチアカウントコネクタ、および根本原因分析のための新しいConnectors Debuggerが含まれており、すべてエンタープライズシステムとの安全で監査可能な統合をサポートしています。

lab Anthropic News · 7日前

Slackチーム向けClaude Tagの発表

Claude Tagを使用すると、チームはSlack上で@Claudeにタグを付けてタスクを委任できます。選択されたチャンネル、ツール、コードベースへのアクセスが可能です。チャンネルのコンテキストから学習し、非同期で動作し、関連する情報を積極的にユーザーに更新することで自律的に行動します。現在、Anthropicのプロダクトチームのコードの65%が内部Claude Tagによって作成されており、Claude EnterpriseおよびTeamのお客様向けにベータ版が利用可能になりました。

lab Mistral AI News · 7日前

MistralがOCR 4をリリース、多言語サポートと構造化出力に対応

Mistral OCR 4は、10の言語グループに属する170言語に対して、境界ボックス、ブロック分類、およびインライン信頼度スコアを導入します。人間の好みによる評価では72%の勝利率を記録し、主要なOCRシステムを上回り、OlmOCRBenchで85.20という最高スコアを達成しました。また、単一コンテナでのセルフホストデプロイメントを提供し、RAGやドキュメント取り込みなどのエンタープライズユースケースにも対応しています。