HP Inc., OpenAI와 프론티어 전략적 파트너십 발표
HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.
HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.
llama.cpp 프로젝트는 추론 토큰을 유지하기 위해 Jinja 채팅 템플릿용 새로운 `--reasoning-preserve` 플래그를 도입한 버전 b9837을 출시했습니다. 이 업데이트에는 수정된 도움말 메시지가 포함되어 있으며, 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler 에 대한 사전 빌드된 바이너리를 제공합니다.
llama.cpp 프로젝트는 단일 모델 모드에서 정지 및 추론 건너뛰기 기능에 대한 수정을 포함하는 버전 b9835를 출시했습니다. 이 업데이트는 모델 추론 중 제어를 개선하기 위해 사용자 인터페이스 내의 특정 문제를 해결합니다.
llama.cpp 프로젝트가 버전 b9833을 출시하여, 다양한 버그 수정 및 리팩토링과 함께 MiniCPM5 모델 전용 파서를 도입했습니다. 이 업데이트에는 도구 호출 파싱 지원, 구문 단순화, 그리고 Jinja2 표준과의 호환성을 보장하기 위해 수정된 Jinja API 동작이 포함됩니다.
llama.cpp 프로젝트가 버전 b9832를 출시했으며, 이는 Jinja 템플릿 엔진을 위한 새로운 `--dump-prog` 명령줄 옵션을 도입하여 디버깅을 지원합니다. 이 업데이트는 다양한 CPU 및 GPU 아키텍처에서 macOS, Linux, Android, Windows, openEuler용 사전 빌드된 바이너리도 포함합니다.
llama.cpp b9831 릴리스는 레이어 유형별 슬라이딩 윈도우 어텐션을 포함한 DFlash v2 지원을 도입하고, 여러 플랫폼을 위한 광범위한 사전 빌드된 바이너리를 제공합니다.
llama.cpp b9830 릴리스는 llama download 명령어와 함께 --offline 플래그를 사용할 수 있는 기능을 도입하여, 스크립트가 네트워크 접근 없이 캐시된 모델을 확인할 수 있게 합니다. 이 업데이트는 URL 작업의 on_done 콜백에서 first_path가 참조로 잘못 캡처되어 발생했던 잠재적인 use-after-free 취약점도 해결합니다.
llama.cpp 프로젝트는 서버, 공통 구성 요소, 추론 디코딩 모듈에서 로깅 출력을 줄인 버전 b9829를 출시했습니다. 이 업데이트는 CMN_을 COM_로 교체하여 명명 규칙을 표준화합니다.
llama.cpp b9828 릴리스는 f16 및 f32 정밀도를 위한 Flash Attention 커널을 재구성하는 등 상당한 OpenCL 향상 기능을 도입합니다. 이 업데이트에는 새로운 prefill prepass 커널과 q4_0 및 q8_0 양자화 형식에 대한 지원이 포함됩니다.
llama.cpp b9827 릴리스는 ggml_cuda_cpy 함수에 cudaMemcpy2DAsync 빠른 경로를 추가하여 CUDA의 성능을 최적화합니다. 이 변경은 텐서가 완전히 연속적이지 않지만 각 행이 연속적인 경우, 느린 요소별 스칼라 복사 커널을 대체하여 동일한 타입과 동일한 모양의 스트라이드 복사를 가속화합니다.
llama.cpp 프로젝트가 제로 입력 처리 시 Vulkan 단계 연산자를 수정한 버전 b9825를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android, openEuler용 사전 빌드 바이너리를 제공합니다.
llama.cpp 프로젝트는 SYCL의 norm 함수와 관련된 단위 테스트 실패를 수정한 b9826 릴리스를 게시했습니다. 이 업데이트는 여러 플랫폼과 하드웨어 가속기에서 사전 빌드된 바이너리와 프레임워크를 제공합니다.
llama.cpp 프로젝트는 macOS, iOS, Linux, Android 및 Windows용 사전 빌드된 바이너리를 제공하는 b9822 릴리스를 게시했습니다. 이 업데이트에는 test-chat-template --no-common 옵션에 대한 수정 사항이 포함되어 있으며 다양한 하드웨어 아키텍처와 가속기에서 빌드를 배포합니다.
llama.cpp 프로젝트는 macOS, iOS, Linux, Android, Windows, openEuler 플랫폼을 위한 사전 빌드된 바이너리를 제공하는 버전 b9823을 게시했습니다. 이번 릴리스의 주요 변경 사항은 check-release 파이프라인에 Windows OpenVINO 빌드를 추가한 것입니다.
llama.cpp 프로젝트는 rpc-server와 export-graph-ops 바이너리에 대한 개선 사항을 포함한 버전 b9824를 출시했습니다. `export-graph-ops` 도구는 테스트 명명 규칙을 따르도록 이름이 변경되었으며, 시스템 디렉토리 내 충돌을 피하기 위해 `rpc-server`는 `ggml-rpc-server`로 이름이 변경되었습니다.
v0.24.0 릴리스에는 MoE 리팩토링 Qwen3 NVFP4 구성에 대한 GSM8K 시작 시간 초과를 늘리기 위한 지속적인 통합 업데이트가 포함됩니다.
OpenAI는 GPT-5.6 시리즈의 제한된 미리보기를 시작했으며, 플래그십인 Sol, 균형 잡힌 일상 작업을 위한 Terra, 빠르고 저렴한 작업을 위한 Luna 등 세 가지 새로운 모델을 소개했습니다. 이 초기 단계를 거친 후 수주 내에 신뢰할 수 있는 파트너들과 함께 이러한 모델들을 일반 공개할 계획입니다.
llama.cpp 프로젝트가 버전 b9821을 출시했으며, 이는 --version, --licenses, --help 플래그를 호출할 수 있는 명령줄 인터페이스 업데이트를 도입했습니다. 이번 릴리스는 다양한 하드웨어 가속기를 대상으로 macOS, Linux, Android, Windows, openEuler용 포괄적인 사전 빌드 바이너리 세트를 제공합니다.
Claude Code 버전 2.1.195는 여러 수정 사항과 개선 사항을 도입했으며, 여기에는 전체 화면 모드에서 마우스 제어를 위한 새로운 환경 변수와 후크 매처 로직의 정정이 포함됩니다.
llama.cpp b9820 릴리스는 분할 계산 중 동기화를 줄임으로써 성능을 개선했으며, 특히 CUDA 백엔드를 대상으로 합니다. 이 업데이트는 CPU, GPU, 특수 하드웨어 가속기를 위한 macOS, Linux, Windows, Android, openEuler용 사전 빌드 바이너리를 제공합니다.