과학자를 위한 AI 작업대인 Claude Science가 출시되었습니다
Anthropic은 파편화된 과학적 도구를 단일 연구 환경으로 통합하도록 설계된 AI 작업대인 Claude Science를 베타로 출시했습니다. 이 플랫폼은 감사 가능한 아티팩트, 유연한 컴퓨팅 확장성, 그리고 유전체학 및 구조생물학과 같은 도메인을 위한 전문 에이전트를 제공하여 발견을 가속화하는 것을 목표로 합니다.
Anthropic은 파편화된 과학적 도구를 단일 연구 환경으로 통합하도록 설계된 AI 작업대인 Claude Science를 베타로 출시했습니다. 이 플랫폼은 감사 가능한 아티팩트, 유연한 컴퓨팅 확장성, 그리고 유전체학 및 구조생물학과 같은 도메인을 위한 전문 에이전트를 제공하여 발견을 가속화하는 것을 목표로 합니다.
Anthropic은 Claude Sonnet 5를 출시했습니다. 이는 이전의 Opus 클래스 모델보다 낮은 비용으로 복잡한 계획, 도구 사용 및 자율적 코딩 작업을 수행하도록 설계된 새로운 에이전트형 AI 모델입니다. 이번 업데이트는 Sonnet 4.6 대비 추론, 안전성, 실행 측면에서 상당한 개선을 제공하면서도 Opus 4.8과의 성능 격차를 좁혔습니다.
GeneBench-Pro는 복잡한 유전체 추론 작업을 위해 모델을 평가하도록 설계된 벤치마크로, 대표적인 질문과 지원 자료를 보여주는 10개의 상세한 사례 연구를 특징으로 합니다. 각 사례 연구는 특정 생물학적 과제에 대한 모델 성능을 평가하는 데 필요한 원래 프롬프트, 데이터셋 및 컨텍스트를 제공합니다.
GeneBench-Pro는 원래 GeneBench를 확장하여 AI 에이전트가 계산 생물학에서 불확실성을 어떻게 처리하고 중요한 판단을 내리는지를 측정하기 위해 설계된 연구 수준 벤치마크입니다. 이는 데이터 노이즈 처리, 가정 수정, 결과가 결정 가능한 상태인지 판별하는 것과 같은 고차원 능력을 테스트함으로써 현재 평가의 한계를 극복합니다.
OpenAI Signals 데이터는 전 세계적으로 ChatGPT 채택이 확산되고 심화되고 있음을 보여주며, 사용자들이 매일 50% 더 많은 메시지를 보내고 가입 후 6개월 만에 시도한 고유 작업 수가 두 배가 되었음을 나타냅니다.
OpenAI Economic Research은 ESCO 분류 체계와 유로스타 데이터를 활용하여 EU로 AI 일자리 전환 프레임워크를 확장했으며, 이는 AI 역량이 회원국 전반의 노동 시장을 어떻게 재편할 수 있는지 분석하는 데 사용되었습니다.