전체 기사
github llama.cpp · 1일 전

llama.cpp b9848 릴리스는 CUDA get_rows_back 오류를 수정하고 바이너리를 제공합니다

llama.cpp 프로젝트는 65535개 이상의 행을 가진 테이블에서 `get_rows_back` 함수의 문제를 해결하기 위해 CUDA 백엔드에 대한 중요한 수정 사항을 포함하는 버전 b9848을 출시했습니다. 이 업데이트는 이전에 대규모 테이블 작업에 영향을 미쳤던 grid-y 클램핑 및 스트라이드 오류를 해결합니다.

lab Microsoft Research Blog · 2일 전

Memora: 추상화와 구체성을 균형 있게 조화시키는 기억 표현

Microsoft Research는 장기 AI 작업에서 추상화와 구체성의 균형을 맞추도록 설계된 확장 가능한 에이전트 메모리 프레임워크인 Memora를 소개합니다. 이 시스템은 풍부한 메모리 내용을 경량 검색 구조와 분리하여, 컨텍스트 토큰을 최대 98%까지 줄이면서 벤치마크에서 새로운 최첨단 결과를 달성했습니다.