Claude v2.1.187 릴리스 노트
Claude v2.1.187는 샌드박스 자격 증명 차단, 조직 구성 모델 제한, 전체 화면에서 마우스 클릭 지원, 명령 실패/도구 멈춤/UI 안정성 관련 수정 사항을 도입합니다. 업데이트는 구조화된 출력 처리, 에이전트 깊이 추적, 플러그인 관리를 개선하며 VSCode 및 터미널 호환성도 강화됩니다.
Claude v2.1.187는 샌드박스 자격 증명 차단, 조직 구성 모델 제한, 전체 화면에서 마우스 클릭 지원, 명령 실패/도구 멈춤/UI 안정성 관련 수정 사항을 도입합니다. 업데이트는 구조화된 출력 처리, 에이전트 깊이 추적, 플러그인 관리를 개선하며 VSCode 및 터미널 호환성도 강화됩니다.
OpenAI는 앱피아 재단을 통해 평가 프레임워크 개발, 안전 관행 수립 및 글로벌 협력 증진을 통해 고급 AI의 공유된 표준을 추진하고 있습니다.
Claude Tag은 Slack에서 @Claude를 태그하여 작업을 위임할 수 있게 하며, 선택된 채널, 도구, 코드베이스에 접근할 수 있습니다. 채널 컨텍스트로부터 학습하고 비동기적으로 작동하며, 관련 정보를 사용자에게 능동적으로 업데이트하여 주도성을 발휘합니다. 현재 Anthropic 제품 팀 코드의 65%가 내부 Claude Tag을 통해 생성되었으며, 이제 Claude Enterprise 및 Team 고객을 대상으로 베타 버전으로 제공됩니다.
GPT-5 Pro는 T 세포 행동에 대한 핵심 통찰력을 제공하여 3년 된 면역학 퍼즐을 해결했습니다. 이 발견은 암 및 자가면역 질환 연구에 진전을 가져올 수 있습니다.
Mistral OCR 4는 10개 언어 그룹에 걸쳐 170개 언어에 대한 바운딩 박스, 블록 분류, 인라인 신뢰도 점수를 도입합니다. 이는 인간 선호도 평가에서 72%의 승률로 주요 OCR 시스템을 압도하며 OlmOCRBench에서 85.20점으로 최고 점수를 달성합니다. 또한 단일 컨테이너로 자체 호스팅 배포를 제공하고 RAG 및 문서 수집과 같은 엔터프라이즈 사용 사례를 지원합니다.
22개국에서 온 81명의 AI 사용자들을 대상으로 한 글로벌 조사 결과, 비영어권 사용자의 89.5%가 인지된 정확도를 이유로 AI 사용 시 영어로 전환하는 것으로 나타났다.
Omio는 OpenAI를 활용하여 대화형 여행 경험을 강화합니다. 이 회사는 AI를 사용하여 제품 개발을 가속화하고 AI 네이티브 비즈니스 모델로 전환하고 있습니다.
Claude v2.1.186은 MCP 서버를 위한 CLI 인증 명령어, 워크플로우의 상태 필터링, 플러그인 설정의 "스킬" 섹션을 추가합니다. UI, 세션 관리, 에이전트 동작에 대한 수많은 버그 수정과 YAML 파싱, 메모리 처리, 도구 검증 개선이 포함됩니다.
제이슨 리우는 코덱스가 어떻게 컨텍스트를 보존하고 복잡한 프로젝트를 관리하여 단일 프롬프트를 넘어 작업을 원활하게 이어갈 수 있는지 보여줍니다.
OpenAI는 데이크브레이크 스위트의 일환으로 Codex Security와 GPT-5.5-Cyber를 선보였습니다. 이 도구들은 조직이 대규모로 취약점을 식별하고 검증하며 패치할 수 있도록 지원합니다.
OpenAI는 오픈소스 유지관리자들이 취약점을 식별하고 검증하며 해결할 수 있도록 돕기 위한 Daybreak 이니셔티브인 'Patch the Planet'을 출시했습니다. 이 프로그램은 AI 도구와 전문가 검토를 결합하여 오픈소스 소프트웨어의 보안을 강화합니다.
삼성전자가 전 세계 직원들을 대상으로 OpenAI의 ChatGPT Enterprise와 Codex를 출시했습니다. 이번 도입은 지금까지 OpenAI가 진행한 기업용 AI 프로젝트 중 최대 규모입니다.
기존의 안전 장치와 실시간 모니터링 기능을 통합하여 내부 시스템을 보호하기 위해 AI 통제 로드맵이 도입되었습니다.
GPT-5.5 Instant은 더 강력한 추론, 개선된 컨텍스트 처리, 명확한 의사소통, 그리고 의사가 참여한 평가를 통해 ChatGPT의 건강 및 웰빙 응답을 개선합니다.
Nature에 게재된 연구에 따르면 대화형 AI 시스템인 AMIE는 복잡한 건강 상태를 관리하는 데 있어 일차 의료 전문가들과 동등한 성과를 보임.
영국 정부는 주택 계획 결정을 가속화하기 위해 설계된 AI 기반 프로토타입을 개발하기 위해 구글 딥마인드와 파트너십을 맺었습니다. 이 이니셔티브는 의사결정 효율성을 개선하기 위해 인공지능을 활용하여 주택 건설 과정을 간소화하는 것을 목표로 합니다.
OpenAI는 ChatGPT Enterprise를 위해 새로운 지출 제어 및 사용량 분석 기능을 도입했습니다. 이 기능들은 기업이 AI 사용량을 확장하면서 비용을 관리하고 정보에 기반한 결정을 내릴 수 있도록 지원합니다.
스트림 정지 힌트가 이제 "API 응답 대기 중 · …초 후 재시도"를 표시하며, 이전 메시지 및 지연 시간을 대체하고 20초의 무음 상태 후에 활성화됩니다.
v2.1.183은 명시적인 사용자 동의 없이 파괴적인 git 및 destroy 명령을 차단하여 자동 모드 안전성을 개선했습니다. 모델에 대한 사용 중단 경고(deprecation warnings)를 추가하고, attribution.sessionUrl을 통해 세션 링크를 숨기며, 터미널 동작, 서브에이전트 성능, 웹 및 tmux 환경에서의 입력 처리를 포함한 여러 문제를 수정했습니다.
LangGraph가 버전 1.2.6을 출시했습니다. 이 업데이트는 중첩된 서브그래프가 부모의 checkpoint_ns를 잘못 상속하는 회귀 문제를 수정합니다. 또한 스트림 중단 시 실행 중인 서브그래프의 취소 기능을 개선했으며, CLI 버전도 0.4.30으로 업데이트되었습니다.