전체 기사 — korshunov.ai

전체 기사 페이지 4 / 8

MCP Python SDK v2.0.0a3 릴리스 노트

Model Context Protocol (MCP) Python SDK가 세 번째 알파 버전인 v2.0.0a3를 출시했으며, 이는 안정적인 1.x 사용자를 위한 하위 호환성을 유지하면서 상당한 프로토콜 및 아키텍처 변경 사항을 도입했습니다.

github llama.cpp · 5일 전

llama.cpp b9810 릴리스는 cublasSgemmBatched 매핑과 새로운 바이너리를 추가합니다

llama.cpp 프로젝트는 HIP/MUSA 벤더 헤더에 `cublasSgemmBatched`에 대한 CUDA 매핑을 도입한 버전 b9810을 출시했습니다. 이 업데이트에는 macOS, Linux, Windows, Android, openEuler 플랫폼을 위한 광범위한 사전 빌드 바이너리 세트가 동반됩니다.

github MCP (GitHub org) · 5일 전

Model Context Protocol Python SDK v1.28.1 릴리스

Model Context Protocol Python SDK가 버전 1.28.1을 출시하여 스트림 처리 및 전송 보안에 대한 업데이트를 도입했습니다.

github llama.cpp · 5일 전

llama.cpp b9804 릴리스: Mamba2 수정 및 새로운 바이너리

llama.cpp b9804 릴리스는 고정된 2x 확장 계수와 유효하지 않은 매개변수 검사를 제거하여 Mamba2 아키텍처에 대한 수정을 도입하고, 모든 expand 값을 지원할 수 있도록 합니다. 이 변경은 expand 매개변수를 기본값 2로 선택적으로 만드는 `convert_hf_to_gguf.py` 스크립트를 업데이트합니다.

github llama.cpp · 6일 전

OpenCL 프로파일링 수정이 포함된 llama.cpp b9803 릴리스

llama.cpp 프로젝트가 버전 b9803을 출시했으며, 여기에는 불완전한 배치에 대해 종료 시 OpenCL의 프로파일링 배치를 플러시하는 수정 사항이 포함되어 있습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler용 바이너리를 제공합니다.

github llama.cpp · 6일 전

llama.cpp b9802 릴리스는 macOS, Linux, Windows 및 Android용 바이너리를 제공합니다

llama.cpp 프로젝트가 여러 운영 체제와 하드웨어 아키텍처에서 사전 빌드된 바이너리를 제공하는 b9802 릴리스를 게시했습니다. 이 업데이트에는 macOS, Linux, Windows, Android, openEuler 플랫폼에서 CPU, GPU 및 특수 AI 가속기에 대한 지원이 포함됩니다.

github SGLang · 6일 전

v0.5.14

본 기사에서는 버전 0.5.14의 출시를 발표합니다.

lab Claude Code Releases · 6일 전

Claude Code v2.1.193 릴리스 노트

Claude Code 버전 2.1.193은 자동 모드 분류, 텔레메트리 로깅 및 백그라운드 에이전트 관리에 여러 개선을 도입합니다. 이 업데이트에는 UI 상태 문제, MCP 서버의 인증 처리, 다양한 백그라운딩 버그 수정도 포함됩니다.

lab Cohere Blog · 6일 전

AI 에이전트를 활용한 포크 유지보수 자동화

이 글은 AI 코딩 에이전트를 사용하여 소프트웨어 포크의 유지보수를 자동화하는 방법을 설명하며, Cohere의 vLLM 포크에 이를 적용합니다. 이 접근 방식은 수동 개입을 자동화된 피드백 루프로 대체함으로써 상위 저장소(upstream) 릴리스를 통합하는 데 걸리는 시간을 주에서 일로 단축합니다.

lab Microsoft Research Blog · 6일 전

AI 기반 설명과 실험으로 뇌 이해하기

연구자들은 해석 불가능한 LLM 기반 뇌 예측 모델을 피질 기능에 대한 간결하고 검증 가능한 언어 가설로 변환하는 프레임워크인 생성 인과 테스트(GCT)를 개발했습니다. 이 방법은 특정 뇌 영역이 "음식 준비"와 같은 것에 반응한다는 것을 설명하는 짧은 구절로 모델 매개변수를 압축한 후, 표적 fMRI 실험을 통해 이러한 설명을 검증합니다.

lab Google — The Keyword (AI) · 6일 전

구글 파이낸스, 새로운 안드로이드 앱과 함께 베타 종료

구글 파이낸스가 공식적으로 베타 단계를 벗어나 안드로이드 기기를 위한 전용 애플리케이션을 출시합니다.

github vLLM · 6일 전

v0.24.0rc2: DP Supervisor와 함께 P/D 수정 (#46628)

이 릴리스 후보는 vLLM 프로젝트 내에서 데이터 병렬화(DP) Supervisor와 함께 Prefill/Decode(P/D) 기능에 대한 수정을 다룹니다.

lab Cohere Blog · 6일 전

Cohere, 커스텀 MCP 서버를 통해 North와 Wiz로 인시던트 대응 자동화

Cohere는 엔터프라이즈 AI 플랫폼인 Cohere North를 사용하여 보안 에이전트를 개발했으며, 이는 커스텀 Model Context Protocol (MCP) 서버를 통해 클라우드 보안 플랫폼 Wiz와 통합되었습니다. 이 아키텍처는 8개의 원자적 도구를 통해 North를 Wiz의 GraphQL API에 연결하여 단일 프롬프트에서 인시던트 대응 워크플로우를 자동화합니다. 시스템은 약 20초 만에 공격 체인을 평가하고 인터넷 노출 및 권한 수준을 기반으로 위험도를 순위 매김하여 유해한 조합의 폭발 반경 분석을 수행합니다. 또한 이슈 세부 정보 검색, Linear 티켓 생성, Wiz 상태 업데이트, 구조화된 인시던트 대응 보고서 작성을 통해 종단 간 조사를 자동화합니다. 추가로 매주 월요일 아침 수동 개입 없이 보안 포지션 브리핑을 생성하는 예약된 주간 자동화가 제공됩니다. 이 통합은 각 발견 사항당 30분에서 2시간에 걸친 이전의 분류 루프를 제거하여 엔지니어가 원시 알림이 아닌 평가 검토에 집중할 수 있도록 합니다.

github llama.cpp · 6일 전

llama.cpp b9788, 듀얼 GPU 환경용 SYCL 텐서 병렬성 추가

llama.cpp의 릴리스 b9788은 SYCL 백엔드에서 --split-mode tensor 플래그를 통해 텐서 병렬성에 대한 지원을 도입합니다. 이 구현은 meta-백엔드에 comm_init, comm_free 및 comm_allreduce_tensor 함수를 추가하여 듀얼 GPU 간 통신을 가능하게 합니다. 두 장치의 경우, 작은 텐서는 FP32 직접 memcpy로, 큰 텐서는 BF16 압축으로 전환하는 링 all-reduce 전략을 사용합니다. 이 코드는 단일 프로세스당 단일 장치라는 제한 사항으로 인해 OneCCL을 피하고 대신 영구 버퍼를 사용하여 SYCL 풀 불변성을 유지합니다. 듀얼 Intel Arc Pro B70 GPU에서의 성능 테스트는 Llama-3.3-70B 및 Qwen3-Coder-Next-80B-A3B 모델에 대해 레이어 모드 대비 상당한 속도 향상을 보여줍니다. 이 업데이트에는 CPU, CUDA, ROCm, Vulkan 및 SYCL 타겟을 위한 macOS, Linux, Windows, Android 및 openEuler용 새로운 바이너리가 포함되어 있습니다.

github llama.cpp · 6일 전

llama.cpp b9789 릴리스는 MoE 양자화 수정 및 멀티플랫폼 바이너리 제공

llama.cpp 프로젝트가 혼합 전문가(MoE) 모델을 멀티 토큰 예측으로 양자화하는 것에 대한 중요한 수정을 포함한 버전 b9789를 출시했습니다. 이 업데이트는 이러한 특정 모델 아키텍처의 적절한 처리를 보장하기 위해 풀 리퀘스트 #24986에서 식별된 문제를 해결합니다. 이번 릴리스는 macOS Apple Silicon 및 Intel용 사전 빌드 바이너리와 iOS XCFramework를 제공합니다. Linux 사용자는 CPU, Vulkan, ROCm 7.2, OpenVINO 및 SYCL 백엔드에 대한 Ubuntu 빌드를 다운로드할 수 있습니다. Windows 지원에는 CPU, CUDA 12.4 및 13.3, Vulkan, OpenVINO, SYCL 및 HIP 변형이 포함됩니다. Android arm64 및 openEuler와 같은 추가 플랫폼도 특정 하드웨어 구성으로 지원됩니다.

lab OpenAI News · 6일 전

OpenAI 연구, AI 에이전트가 업무를 혁신함을 보여줌

OpenAI의 새로운 연구 논문은 인공지능 에이전트들이 업무의 본질을 근본적으로 어떻게 변화시키고 있는지 보여줍니다. 이 연구는 이러한 에이전트들이 이전보다 더 길고 복잡한 작업을 수행할 수 있는 능력을 강조합니다. 이 기술적 진보는 광범위한 전문 직군 전반에 걸쳐 생산성을 확장한 것으로 평가됩니다. 연구 결과는 자동화를 통해 노동이 조직되고 수행되는 방식에 상당한 변화가 있음을 시사합니다. AI 에이전트는 복잡한 워크플로우를 처리함으로써 사용자가 더 높은 효율을 달성할 수 있도록 지원합니다. 이 논문은 자율 시스템이 현대 고용에 미치는 영향이 커지고 있다는 증거로 작용합니다.

github llama.cpp · 6일 전

SYCL의 conv_3d에 대한 실패한 단위 테스트 케이스 수정

llama.cpp 저장소에서 SYCL 백엔드와 관련된 특정 문제를 해결했습니다. conv_3d 연산과 연결된 실패한 단위 테스트 케이스를 수정하기 위한 풀 리퀘스트가 제출되었습니다. 이 업데이트는 GitHub의 ggml-org/llama.cpp 프로젝트를 대상으로 합니다. 이 변경 사항은 이전에 테스트의 성공적인 실행을 방해하던 오류들을 해결합니다. 이 수정은 SYCL 기반 하드웨어 가속을 사용하는 사용자에게 더 나은 안정성을 보장합니다.

github llama.cpp · 7일 전

llama.cpp b9786 릴리스, OpenCL 비연속 행 지원 추가

llama.cpp 프로젝트가 버전 b9786을 출시하여 정규화에서 OpenCL을 통한 비연속 행 지원을 도입했습니다. 이 업데이트는 ggml-org 팀이 다양한 플랫폼 전반의 하드웨어 호환성과 성능을 향상시키기 위해 진행 중인 개발의 일부입니다. 이번 릴리스에는 macOS Apple Silicon, Intel Mac, iOS XCFrameworks용 바이너리가 제공됩니다. Linux 사용자는 CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL 백엔드를 사용하여 Ubuntu x64, arm64, s390x 아키텍처에 대한 빌드에 접근할 수 있습니다. Android 지원은 arm64 CPU 장치를 위해 제공되며, Windows는 CPU, CUDA 12 및 13, Vulkan, OpenVINO, SYCL, HIP을 포함한 광범위한 옵션을 제공합니다. 또한 이번 릴리스에서는 macOS와 openEuler 플랫폼에서 KleidiAI 빌드가 비활성화되었음을 명시하고 있습니다.

github llama.cpp · 7일 전

단단한 캡 체크와 다중 플랫폼 바이너리를 포함한 llama.cpp b9785 릴리스

llama.cpp 프로젝트는 pull request #24973에 자세히 설명된 대로 캡 체크를 강화하는 코드 변경을 특징으로 하는 버전 b9785를 출시했습니다. 이 업데이트는 macOS Apple Silicon, Intel Mac 및 XCFramework를 통한 iOS용 사전 빌드 바이너리를 제공하며, Apple Silicon에서는 KleidiAI 지원이 비활성화됩니다. Ubuntu를 포함한 Linux 배포판은 x64, arm64, s390x 아키텍처 전반에 걸쳐 CPU, Vulkan, ROCm 7.2, OpenVINO 및 SYCL 백엔드를 지원합니다. Android 사용자는 arm64 CPU 바이너리에 접근할 수 있으며, Windows는 CPU, OpenCL Adreno, CUDA 12 및 13, Vulkan, OpenVINO, SYCL 및 HIP을 포괄하는 광범위한 옵션을 제공합니다. 이 릴리스에는 ACL Graph 지원을 갖춘 x86 및 aarch64 프로세서 대상 openEuler 빌드도 포함되어 있습니다. 로컬 모델 추론을 촉진하기 위해 플랫폼별 릴리스와 함께 독립형 UI 패키지가 제공됩니다.

lab Claude Code Releases · 7일 전

Claude Code v2.1.191 릴리스 노트

Claude Code 버전 2.1.191은 /clear 명령이 실행되기 전부터 대화를 재개할 수 있는 /rewind 지원을 도입합니다. 이 업데이트는 중지된 후 백그라운드 에이전트가 다시 활성화되는 문제와 스트리밍 응답 중 스크롤 위치가 점프하는 문제를 포함한 여러 중요한 이슈를 수정합니다. 또한 /voice에서 일반 오류 메시지가 표시되던 문제와 Windows Terminal에서 /login URL이 잘리던 문제의 동작을 정정합니다. 기능 탐색 및 OAuth 흐름 중 일시적인 네트워크 오류에 대한 재시도 로직을 추가하여 MCP 서버의 신뢰성을 크게 향상시켰습니다. 헤드리스 환경에서는 이제 OAuth를 위한 브라우저 팝업을 건너뛰며, 샌드박스 네트워크 권한은 세션 기간 동안 기억됩니다. 텍스트 업데이트 통합을 통해 스트리밍 중 CPU 사용량을 약 37% 줄이고 터미널 출력 캐시로 인한 장기 세션 메모리 증가를 완화하는 성능 최적화가 이루어졌습니다.