llama.cpp b9829 릴리스: 로그 감소 및 다중 플랫폼 바이너리
llama.cpp 프로젝트는 서버, 공통 구성 요소, 추론 디코딩 모듈에서 로깅 출력을 줄인 버전 b9829를 출시했습니다. 이 업데이트는 CMN_을 COM_로 교체하여 명명 규칙을 표준화합니다.
llama.cpp 프로젝트는 서버, 공통 구성 요소, 추론 디코딩 모듈에서 로깅 출력을 줄인 버전 b9829를 출시했습니다. 이 업데이트는 CMN_을 COM_로 교체하여 명명 규칙을 표준화합니다.
llama.cpp b9828 릴리스는 f16 및 f32 정밀도를 위한 Flash Attention 커널을 재구성하는 등 상당한 OpenCL 향상 기능을 도입합니다. 이 업데이트에는 새로운 prefill prepass 커널과 q4_0 및 q8_0 양자화 형식에 대한 지원이 포함됩니다.
llama.cpp b9827 릴리스는 ggml_cuda_cpy 함수에 cudaMemcpy2DAsync 빠른 경로를 추가하여 CUDA의 성능을 최적화합니다. 이 변경은 텐서가 완전히 연속적이지 않지만 각 행이 연속적인 경우, 느린 요소별 스칼라 복사 커널을 대체하여 동일한 타입과 동일한 모양의 스트라이드 복사를 가속화합니다.
llama.cpp 프로젝트가 제로 입력 처리 시 Vulkan 단계 연산자를 수정한 버전 b9825를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android, openEuler용 사전 빌드 바이너리를 제공합니다.
llama.cpp 프로젝트는 SYCL의 norm 함수와 관련된 단위 테스트 실패를 수정한 b9826 릴리스를 게시했습니다. 이 업데이트는 여러 플랫폼과 하드웨어 가속기에서 사전 빌드된 바이너리와 프레임워크를 제공합니다.
llama.cpp 프로젝트는 macOS, iOS, Linux, Android 및 Windows용 사전 빌드된 바이너리를 제공하는 b9822 릴리스를 게시했습니다. 이 업데이트에는 test-chat-template --no-common 옵션에 대한 수정 사항이 포함되어 있으며 다양한 하드웨어 아키텍처와 가속기에서 빌드를 배포합니다.
llama.cpp 프로젝트는 macOS, iOS, Linux, Android, Windows, openEuler 플랫폼을 위한 사전 빌드된 바이너리를 제공하는 버전 b9823을 게시했습니다. 이번 릴리스의 주요 변경 사항은 check-release 파이프라인에 Windows OpenVINO 빌드를 추가한 것입니다.
llama.cpp 프로젝트는 rpc-server와 export-graph-ops 바이너리에 대한 개선 사항을 포함한 버전 b9824를 출시했습니다. `export-graph-ops` 도구는 테스트 명명 규칙을 따르도록 이름이 변경되었으며, 시스템 디렉토리 내 충돌을 피하기 위해 `rpc-server`는 `ggml-rpc-server`로 이름이 변경되었습니다.
v0.24.0 릴리스에는 MoE 리팩토링 Qwen3 NVFP4 구성에 대한 GSM8K 시작 시간 초과를 늘리기 위한 지속적인 통합 업데이트가 포함됩니다.
OpenAI는 GPT-5.6 시리즈의 제한된 미리보기를 시작했으며, 플래그십인 Sol, 균형 잡힌 일상 작업을 위한 Terra, 빠르고 저렴한 작업을 위한 Luna 등 세 가지 새로운 모델을 소개했습니다. 이 초기 단계를 거친 후 수주 내에 신뢰할 수 있는 파트너들과 함께 이러한 모델들을 일반 공개할 계획입니다.
llama.cpp 프로젝트가 버전 b9821을 출시했으며, 이는 --version, --licenses, --help 플래그를 호출할 수 있는 명령줄 인터페이스 업데이트를 도입했습니다. 이번 릴리스는 다양한 하드웨어 가속기를 대상으로 macOS, Linux, Android, Windows, openEuler용 포괄적인 사전 빌드 바이너리 세트를 제공합니다.
Claude Code 버전 2.1.195는 여러 수정 사항과 개선 사항을 도입했으며, 여기에는 전체 화면 모드에서 마우스 제어를 위한 새로운 환경 변수와 후크 매처 로직의 정정이 포함됩니다.
llama.cpp b9820 릴리스는 분할 계산 중 동기화를 줄임으로써 성능을 개선했으며, 특히 CUDA 백엔드를 대상으로 합니다. 이 업데이트는 CPU, GPU, 특수 하드웨어 가속기를 위한 macOS, Linux, Windows, Android, openEuler용 사전 빌드 바이너리를 제공합니다.
llama.cpp 프로젝트는 ggml 라이브러리와의 동기화를 포함하는 버전 b9816을 출시했습니다. 이 업데이트는 macOS, iOS, Linux, Windows, Android 및 openEuler 플랫폼을 위한 사전 빌드된 바이너리를 제공합니다.
llama.cpp b9817 릴리스는 OpenVINO 백엔드를 버전 2026.2.1로 업데이트하고 출시 패키지를 자체 완결형으로 만듭니다. 이 업데이트에는 하드코딩된 compute_op_type 집합 제거와 sink 입력을 사용한 softmax 활성화 등 OpenVINO 백엔드 내 여러 연산자 개선 사항이 포함됩니다.
llama.cpp b9813 릴리스는 INTEL_XE1 아키텍처 열거형을 추가하고 coopmat1을 활성화함으로써 Intel Xe-LPG Plus 하드웨어에 대한 Vulkan 지원을 도입합니다. 이 업데이트는 이전 코드 주석을 처리하고, 아키텍처 식별자를 이름 변경하며, Windows 드라이버 확인을 포함합니다.
llama.cpp 프로젝트는 AMD mi50 GPU를 대상으로 Vulkan의 `mul_mat_vecq` 연산에 대한 최적화를 포함하는 버전 b9814를 출시했습니다. 이 업데이트에는 여러 운영 체제와 하드웨어 아키텍처 전반에 걸친 포괄적인 사전 빌드된 바이너리 세트가 동반됩니다.
Model Context Protocol (MCP) Python SDK가 세 번째 알파 버전인 v2.0.0a3를 출시했으며, 이는 안정적인 1.x 사용자를 위한 하위 호환성을 유지하면서 상당한 프로토콜 및 아키텍처 변경 사항을 도입했습니다.
llama.cpp 프로젝트는 Vulkan의 conv2d coopmat2 경로에 영향을 미치는 컴파일러 버그 수정을 포함한 버전 b9811을 출시했습니다. 이 우회책은 NVIDIA 엔지니어 Jeff Bolz의 제안에 따라 CONV_3D 구현에도 적용되었습니다.
llama.cpp 프로젝트는 HIP/MUSA 벤더 헤더에 `cublasSgemmBatched`에 대한 CUDA 매핑을 도입한 버전 b9810을 출시했습니다. 이 업데이트에는 macOS, Linux, Windows, Android, openEuler 플랫폼을 위한 광범위한 사전 빌드 바이너리 세트가 동반됩니다.