llama.cpp b9840 릴리스는 DeepSeek V4 지원 및 다중 플랫폼 바이너리를 추가합니다

llama.cpp b9840 릴리스는 Pro 변형에 대한 특정 처리를 포함하여 DeepSeek V4 모델의 변환 지원을 도입합니다. 이 업데이트는 다양한 내부 최적화 및 버그 수정과 함께 새로운 아키텍처를 라이브러리에 통합합니다.

dsv4 변환, llm_graph_input_dsv4 및 저장-로드 상태 기능 추가.
필요한 패딩 및 그래프 재사용 메커니즘과 함께 Flash Attention(FA) 활성화.
다중 시퀀스 처리 및 부분 체크포인트 기능 지원.
CPU, GPU 및 ROCm, SYCL, OpenVINO와 같은 특수 가속기를 포함한 macOS, Linux, Android, Windows, openEuler용 바이너리 출시.

이 릴리스를 통해 사용자는 llama.cpp를 사용하여 다양한 하드웨어 구성에서 DeepSeek V4 모델을 로컬로 실행할 수 있습니다.