전체 기사
lab Hugging Face Blog · 17시간 전

ScarfBench: 엔터프라이즈 Java 프레임워크 마이그레이션을 위한 AI 에이전트 벤치마킹

본 기사는 엔터프라이즈 Java 애플리케이션을 다른 프레임워크 간에 마이그레이션하는 동안 AI 에이전트의 성능을 평가하도록 설계된 벤치마크인 ScarfBench를 소개합니다. 이 연구는 프레임워크 마이그레이션의 복잡성을 강조하고 이 영역에서 에이전트 능력을 평가하기 위한 표준화된 평가 방법을 제안합니다.

github llama.cpp · 1일 전

llama.cpp b9857 릴리스: Flash Attention 재구현 및 새로운 바이너리

llama.cpp b9857 릴리스는 Hexagon Flash Attention 구현의 포괄적인 재구현을 도입하여 최적화와 정확도 개선을 중점적으로 다룹니다. 이 업데이트에는 hex-mm 및 hex-fa 모듈에 대한 주요 변경 사항이 포함되어 있으며, 여기에는 양자화 작업을 주 matmul 스레드에 병합하고 ADD 연산과 융합하며 마스크 처리를 최적화하는 작업이 포함됩니다.