llama.cpp b9844 릴리스는 NVFP4 지원 및 새로운 바이너리를 추가합니다
llama.cpp 프로젝트는 NVFP4 양자화 형식에 대한 ggml-webgpu 지원을 도입한 버전 b9844를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, iOS, Linux, Android, Windows 및 openEuler용 사전 빌드된 바이너리도 제공합니다.
llama.cpp 프로젝트는 NVFP4 양자화 형식에 대한 ggml-webgpu 지원을 도입한 버전 b9844를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, iOS, Linux, Android, Windows 및 openEuler용 사전 빌드된 바이너리도 제공합니다.
Google UK는 국가에서 더 많은 사람들이 AI 기반 기술의 혜택을 활용할 수 있도록 돕는 전략을 상세히 담은 최신 경제 영향 보고서를 발표했습니다.
llama.cpp 프로젝트는 macOS, Linux, Android, Windows, openEuler의 다양한 하드웨어 아키텍처를 위한 사전 빌드된 바이너리를 제공하는 b9843 릴리스를 게시했습니다.
LangGraph 버전 1.2.7이 출시되었으며, LangChain 생태계를 위한 버그 수정 및 의존성 업데이트가 포함되었습니다.
Microsoft Research는 장기 AI 작업에서 추상화와 구체성의 균형을 맞추도록 설계된 확장 가능한 에이전트 메모리 프레임워크인 Memora를 소개합니다. 이 시스템은 풍부한 메모리 내용을 경량 검색 구조와 분리하여, 컨텍스트 토큰을 최대 98%까지 줄이면서 벤치마크에서 새로운 최첨단 결과를 달성했습니다.
Claude Code 버전 2.1.196은 조직 기본 모델, 클릭 가능한 파일 첨부, MCP 서버 승인에 대한 보안 강화를 도입합니다. 이 업데이트는 백그라운드 세션의 신뢰성을 향상시키고, 다양한 에이전트 상태 보고 문제를 수정하며, 코드 검토 워크플로우에서 토큰 사용을 최적화합니다.
구글 전문가가 인공지능에 대한 풀스택 접근 방식의 개념을 설명합니다. 이 기사는 이러한 포괄적인 방법론이 구글의 AI 작업을 오랫동안 뒷받침해 왔다고 강조합니다.
llama.cpp b9842 릴리스는 /v1/models 엔드포인트에서 프리셋 및 캐시된 모델 엔트리의 중복을 제거하는 변경 사항을 도입합니다. 이 업데이트는 Hugging Face의 Adrien Gallouët이 승인했습니다.
연구자들은 수술적 임플란트 없이 자기뇌파(MEG) 기록으로부터 실시간 문장을 디코딩하는 비침습적 AI 파이프라인인 Brain2Qwerty v2를 출시했습니다. 이 시스템은 전체적으로 61%의 단어 정확도를 달성하며, 상위 수행자에게는 최대 78%에 달해 기존 비침습적 방법들을 크게 능가합니다.
llama.cpp b9840 릴리스는 Pro 변형에 대한 특정 처리를 포함하여 DeepSeek V4 모델의 변환 지원을 도입합니다. 이 업데이트는 다양한 내부 최적화 및 버그 수정과 함께 새로운 아키텍처를 라이브러리에 통합합니다.
OpenAI Economic Research은 ESCO 분류 체계와 유로스타 데이터를 활용하여 EU로 AI 일자리 전환 프레임워크를 확장했으며, 이는 AI 역량이 회원국 전반의 노동 시장을 어떻게 재편할 수 있는지 분석하는 데 사용되었습니다.
llama.cpp 프로젝트는 무시된 작업 트리의 Tailwind 스캔을 복원하는 수정 사항을 포함하는 버전 b9839를 출시했습니다. 이 업데이트는 다양한 아키텍처와 하드웨어 가속 백엔드에 대해 macOS, Linux, Android, Windows 및 openEuler용 사전 빌드 바이너리를 제공합니다.
llama.cpp 프로젝트가 버전 b9838을 출시하여 광범위한 운영 체제 및 하드웨어 가속기를 위한 사전 빌드된 바이너리를 제공합니다. 이번 릴리스에는 macOS, Linux, Windows, Android, openEuler 전반에 걸친 CPU, GPU(CUDA, Vulkan, ROCm, OpenCL) 및 전용 AI 가속기에 대한 지원이 포함되어 있습니다.
HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.
llama.cpp 프로젝트는 단일 모델 모드에서 정지 및 추론 건너뛰기 기능에 대한 수정을 포함하는 버전 b9835를 출시했습니다. 이 업데이트는 모델 추론 중 제어를 개선하기 위해 사용자 인터페이스 내의 특정 문제를 해결합니다.
llama.cpp 프로젝트가 버전 b9833을 출시하여, 다양한 버그 수정 및 리팩토링과 함께 MiniCPM5 모델 전용 파서를 도입했습니다. 이 업데이트에는 도구 호출 파싱 지원, 구문 단순화, 그리고 Jinja2 표준과의 호환성을 보장하기 위해 수정된 Jinja API 동작이 포함됩니다.
llama.cpp 프로젝트가 버전 b9832를 출시했으며, 이는 Jinja 템플릿 엔진을 위한 새로운 `--dump-prog` 명령줄 옵션을 도입하여 디버깅을 지원합니다. 이 업데이트는 다양한 CPU 및 GPU 아키텍처에서 macOS, Linux, Android, Windows, openEuler용 사전 빌드된 바이너리도 포함합니다.
llama.cpp b9831 릴리스는 레이어 유형별 슬라이딩 윈도우 어텐션을 포함한 DFlash v2 지원을 도입하고, 여러 플랫폼을 위한 광범위한 사전 빌드된 바이너리를 제공합니다.
llama.cpp b9830 릴리스는 llama download 명령어와 함께 --offline 플래그를 사용할 수 있는 기능을 도입하여, 스크립트가 네트워크 접근 없이 캐시된 모델을 확인할 수 있게 합니다. 이 업데이트는 URL 작업의 on_done 콜백에서 first_path가 참조로 잘못 캡처되어 발생했던 잠재적인 use-after-free 취약점도 해결합니다.
llama.cpp 프로젝트는 서버, 공통 구성 요소, 추론 디코딩 모듈에서 로깅 출력을 줄인 버전 b9829를 출시했습니다. 이 업데이트는 CMN_을 COM_로 교체하여 명명 규칙을 표준화합니다.