전체 기사
github llama.cpp · 7시간 전

llama.cpp b9857 릴리스: Flash Attention 재구현 및 새로운 바이너리

llama.cpp b9857 릴리스는 Hexagon Flash Attention 구현의 포괄적인 재구현을 도입하여 최적화와 정확도 개선을 중점적으로 다룹니다. 이 업데이트에는 hex-mm 및 hex-fa 모듈에 대한 주요 변경 사항이 포함되어 있으며, 여기에는 양자화 작업을 주 matmul 스레드에 병합하고 ADD 연산과 융합하며 마스크 처리를 최적화하는 작업이 포함됩니다.

lab Microsoft Research Blog · 1일 전

SkillOpt: 에이전트 스킬을 학습 가능한 파라미터로

Microsoft Research는 SkillOpt를 소개합니다. 이는 에이전트 스킬 파일을 동결된 대상 모델 외부의 학습 가능한 파라미터로 취급하여, 수동 스킬 편집을 제어된 최적화 프로세스로 전환하는 방법입니다. 이 접근 방식은 기본 모델 가중치를 업데이트하지 않고도 에이전트의 신뢰성과 일관성을 향상시킵니다.

lab Anthropic News · 1일 전

과학자를 위한 AI 작업대인 Claude Science가 출시되었습니다

Anthropic은 파편화된 과학적 도구를 단일 연구 환경으로 통합하도록 설계된 AI 작업대인 Claude Science를 베타로 출시했습니다. 이 플랫폼은 감사 가능한 아티팩트, 유연한 컴퓨팅 확장성, 그리고 유전체학 및 구조생물학과 같은 도메인을 위한 전문 에이전트를 제공하여 발견을 가속화하는 것을 목표로 합니다.

lab OpenAI News · 1일 전

Genebench-Pro 내부: 복잡한 유전체 추론의 10가지 사례 연구

GeneBench-Pro는 복잡한 유전체 추론 작업을 위해 모델을 평가하도록 설계된 벤치마크로, 대표적인 질문과 지원 자료를 보여주는 10개의 상세한 사례 연구를 특징으로 합니다. 각 사례 연구는 특정 생물학적 과제에 대한 모델 성능을 평가하는 데 필요한 원래 프롬프트, 데이터셋 및 컨텍스트를 제공합니다.