llama.cpp가 USM 시스템 할당 및 크로스 플랫폼 바이너리와 함께 b9673 출시
llama.cpp 버전 b9673은 GPU 버퍼 ≥1GB에 대한 선택적 USM 시스템 할당을 도입하여 장치 지원이 사용 가능한 경우 VRAM 오버커밋을 활성화합니다. 이 기능에는 GGML_SYCL_USM_SYSTEM 환경 변수가 필요하며 기본적으로 비활성화되어 있고 지원되지 않으면 일반 할당으로 폴백됩니다.
llama.cpp 버전 b9673은 GPU 버퍼 ≥1GB에 대한 선택적 USM 시스템 할당을 도입하여 장치 지원이 사용 가능한 경우 VRAM 오버커밋을 활성화합니다. 이 기능에는 GGML_SYCL_USM_SYSTEM 환경 변수가 필요하며 기본적으로 비활성화되어 있고 지원되지 않으면 일반 할당으로 폴백됩니다.
v2.1.179는 중간 연결 끊김, WSL2의 마우스 휠 스크롤 문제, 과도한 Bash 도구 설명을 유발하는 샌드박스 글롭 버그를 수정합니다. 또한 피드백 설문 조사 오류, 프로모션 배너 중첩, 서브에이전트 뷰의 포커스 문제를 해결하고 원격 세션에서 플러그인 로드를 개선합니다.
llama.cpp가 버전 b9660을 출시하여 LFM2 도구 호출 파싱의 이중 이스케이프 문제를 수정했습니다. 이번 업데이트에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며, 여러 아키텍처와 하드웨어 가속 옵션을 지원하고 전용 UI 패키지도 제공됩니다.
호환되는 API 버전 범위를 지원하는 langgraph-cli 버전 0.4.30이 출시되었습니다. 이번 릴리스는 문서화의 일관성을 개선하기 위해 표준화된 README.md 구조도 포함합니다.
Claude v2.1.178은 Tool(param:value) 구문을 사용한 새로운 권한 규칙, 중첩 디렉토리에서의 개선된 워크플로우 및 스킬 로딩, 향상된 자동 모드 및 오류 메시지를 도입합니다. 또한 충돌, 인증 오류, Chrome 및 VSCode의 UI 동작 등 중요한 문제를 수정하고 도구 프롬프트와 실행 취소 기능을 다듬었습니다.
llama.cpp가 버전 b9672를 출시하여 BoringSSL을 0.20260616.0으로 업데이트했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며 Vulkan, CUDA, ROCm, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.
버전 1.38.0에 대한 릴리스 브랜치가 생성되었습니다. 이는 업데이트의 릴리스 프로세스 시작을 알립니다.
llama.cpp 버전 b9669은 Eagle3에 대한 백엔드 샘플링 지원을 추가했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며, Vulkan, CUDA, ROCm, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.
llama.cpp release b9670 에는 llama-graph 의 NVFP4 엣지 케이스에 대한 수정 사항이 포함되어 있습니다. 여기에는 GEMM 후 MUL 작업 이동과 build_ffn 을 지원되는 조합으로 제한하는 것이 포함됩니다. 이 릴리스는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리를 제공하며, CUDA, Vulkan, SYCL 및 OpenVINO 를 포함한 여러 아키텍처와 백엔드 옵션을 지원합니다.
llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.
llama.cpp 버전 b9668 은 0cc4m 의 제안에 따라 UMA 장치에서 더 나은 성능을 위해 UMA 호스트 가시 메모리 버퍼를 구현했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리가 포함되어 있으며 CPU, Vulkan, ROCm, OpenVINO, SYCL 및 HIP 를 지원하고 전용 UI 패키지가 제공됩니다.
llama.cpp 버전 b9665은 벤치마킹을 위한 새로운 --offline 플래그를 도입했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows, openEuler 에 대한 바이너리 빌드가 포함되어 있으며, Vulkan, CUDA, ROCm, OpenVINO, SYCL 을 포함한 여러 아키텍처 및 하드웨어 가속 옵션을 지원합니다.
LLaMA.cpp b9663 릴리스는 OP EXPM1 지원과 FLOOR, TRUNC, ROUND에 대한 모든 단위 테스트 케이스를 추가했습니다. macOS, Linux, Android, Windows, openEuler용 업데이트된 바이너리를 포함하며, SYCL(FP32 및 FP16), Vulkan, CUDA 12.4 및 13.3, ROCm 7.2 지원을 제공하고 UI도 업데이트되었습니다.
sycl 업데이트는 Q4_K, Q5_K 및 Q6_K에 대한 MoE MUL_MAT_ID의 재정렬된 전문가 텐서 처리 지원을 확장합니다. 지원되지 않는 3D 재정렬 사례는 이제 중단하는 대신 폴백으로 전환됩니다.
llama.cpp의 b9661 릴리스는 Vulkan에 GGML_OP_COL2IM_1D 지원을 추가했으며, 모듈로와 함께 전체 K 스캔 대신 제한된 gather 루프를 사용합니다. 지원되지 않는 유형에는 nullptr을 반환하며, CPU, Vulkan, CUDA 및 SYCL에서 macOS, Linux, Android, Windows 및 openEuler용 빌드를 포함합니다.