llama.cpp가 새로운 바이너리와 기능을 갖춘 버전 b9748 출시
llama.cpp는 버전 b9748을 출시하며 스키마에 "verbose" 필드를 추가하고 macOS, Linux, Android, Windows, openEuler용 바이너리를 제공합니다. 이번 릴리스에는 여러 아키텍처에서 CPU, Vulkan, OpenVINO, SYCL, ROCm 지원이 포함되며, iOS 및 Windows CUDA와 Vulkan 빌드도 제공됩니다.
llama.cpp는 버전 b9748을 출시하며 스키마에 "verbose" 필드를 추가하고 macOS, Linux, Android, Windows, openEuler용 바이너리를 제공합니다. 이번 릴리스에는 여러 아키텍처에서 CPU, Vulkan, OpenVINO, SYCL, ROCm 지원이 포함되며, iOS 및 Windows CUDA와 Vulkan 빌드도 제공됩니다.
기존의 안전 장치와 실시간 모니터링 기능을 통합하여 내부 시스템을 보호하기 위해 AI 통제 로드맵이 도입되었습니다.
GPT-5.5 Instant은 더 강력한 추론, 개선된 컨텍스트 처리, 명확한 의사소통, 그리고 의사가 참여한 평가를 통해 ChatGPT의 건강 및 웰빙 응답을 개선합니다.
Nature에 게재된 연구에 따르면 대화형 AI 시스템인 AMIE는 복잡한 건강 상태를 관리하는 데 있어 일차 의료 전문가들과 동등한 성과를 보임.
영국 정부는 주택 계획 결정을 가속화하기 위해 설계된 AI 기반 프로토타입을 개발하기 위해 구글 딥마인드와 파트너십을 맺었습니다. 이 이니셔티브는 의사결정 효율성을 개선하기 위해 인공지능을 활용하여 주택 건설 과정을 간소화하는 것을 목표로 합니다.
OpenAI는 ChatGPT Enterprise를 위해 새로운 지출 제어 및 사용량 분석 기능을 도입했습니다. 이 기능들은 기업이 AI 사용량을 확장하면서 비용을 관리하고 정보에 기반한 결정을 내릴 수 있도록 지원합니다.
llama.cpp 버전 b9747은 SSE 엔드포인트를 통해 실시간 모델 로드 진행 상황 추적을 도입합니다. 이번 릴리스에는 macOS, Linux, Android, Windows, openEuler용 바이너리가 포함되어 있으며, Vulkan, CUDA, OpenVINO, SYCL과 같은 다양한 아키텍처와 가속 기술을 지원합니다.
llama.cpp 버전 b9745는 레이어 오프셋 및 nextn 플래그를 위한 새로운 API를 포함하여 Step3.5/3.7 플래시 MTP3 지원을 도입합니다. 이번 릴리스는 macOS, Linux, Android, Windows, openEuler에 대한 사전 빌드 바이너리를 제공하며, CPU, Vulkan, CUDA, OpenVINO, SYCL 가속 옵션을 제공합니다.
LLaMA.cpp가 macOS, Linux, Android, Windows 및 openEuler용 업데이트된 바이너리를 포함하는 버전 b9744를 출시했습니다. 이번 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL, ROCm과 같은 여러 아키텍처와 하드웨어 가속기에 대한 지원이 포함되어 있습니다. 또한 사용자 인터페이스 접근을 위한 UI 패키지도 제공됩니다.
llama.cpp 버전 b9742는 신경망 연산의 효율성을 개선하기 위해 SSM-conv 가중치에 패딩 스트라이드를 도입했습니다. 이번 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL을 포함한 다양한 아키텍처와 API를 지원하며 macOS, Linux, Android, Windows, openEuler용 바이너리가 포함되어 있습니다.
llama.cpp 버전 b9743은 macOS, Linux, Android, Windows 및 openEuler에서 여러 아키텍처를 위한 새로운 바이너리를 도입합니다. 이번 릴리스에는 Vulkan, CUDA 12.4 및 13.3, OpenVINO, SYCL, ROCm에 대한 지원이 포함되며, JSON 스키마를 통한 구문 정렬로 업데이트된 UI와 개선된 파서 간격 규칙을 제공합니다.
스트림 정지 힌트가 이제 "API 응답 대기 중 · …초 후 재시도"를 표시하며, 이전 메시지 및 지연 시간을 대체하고 20초의 무음 상태 후에 활성화됩니다.
llama.cpp 버전 b9741은 여러 아키텍처에서 macOS, Linux, Android, Windows, openEuler용 새로운 바이너리를 도입합니다. 이번 릴리스에는 Vulkan, CUDA 12.4 및 13.3, OpenVINO, SYCL, ROCm에 대한 지원이 포함되며 iOS와 Ubuntu의 버전도 업데이트되었습니다.
패치는 argc가 일치할 때만 argv 오버라이드를 적용하여 프로그램적 인수의 덮어쓰기를 방지함으로써 Windows에서 test-args-parser의 랜덤 실패를 해결합니다. 이는 실제 바이너리에 대한 UTF-8 처리를 유지하면서 OpenVINO Windows 워크플로우의 fastfail 어설션을 수정합니다.
LLaMA.cpp 버전 b9739는 OpenCL Adreno를 통해 Windows ARM64 지원을 추가했습니다. 이번 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL을 포함한 다양한 아키텍처와 API에 걸쳐 macOS, Linux, Android, Windows, openEuler용 바이너리가 포함되어 있습니다.
llama.cpp 버전 b9738은 인증 헤더를 전달하지 않도록 CORS 프록시를 수정했습니다. 이번 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션에 대한 macOS, Linux, Android, Windows, openEuler용 바이너리 빌드가 포함되어 있습니다.
ggml 프로젝트는 모든 스레드가 양자화에 참여하도록 n_batch * M에 대한 파티션을 평활화하여 AMX 성능을 최적화했습니다. 이 변경은 CPU 및 GPU 플랫폼에서 다양한 모델과 하드웨어 구성에 걸쳐 최대 1.47배의 속도 향상을 가져왔으며, 추론 시간에서 일관된 개선 결과를 보여줍니다.
GLM-5.2 모델의 DSA 인덱서가 모든 레이어에 잘못 로드되어 누락된 텐서로 인해 실패했습니다. 이번 업데이트는 인덱서 텐서를 TENSOR_NOT_REQUIRED로 표시하여, 인덱서가 없는 레이어가 nullptr로 로드되도록 하고 전체 MLA 어텐션을 가능하게 합니다. 균일한 인덱싱을 사용하는 DeepSeek-V3.2는 영향을 받지 않습니다.
Docker에서 s390x 아키텍처를 위한 사전 빌드된 웹 UI를 추가하기 위한 풀 리퀘스트가 제출되었습니다. 이 변경 사항은 현재 릴리스 대기 중이며 아직 공개되지 않았습니다.
LLaMA.cpp는 macOS, Linux, Android, Windows 및 openEuler용 업데이트된 바이너리가 포함된 버전 b9732를 출시했습니다. 이번 릴리스에는 리팩토링된 자식-투-라우터 통신, 웨이크업 처리 수정, 개선된 update_status() 및 문서가 포함됩니다. 새로운 빌드는 Vulkan, ROCm, OpenVINO, SYCL 및 여러 아키텍처에서 CUDA 12/13을 지원합니다.