Wmf - 새로운 실험적 기법
기사 내용은 저자에 의해 삭제되어 해당 기법에 대한 실질적인 정보가 남아 있지 않습니다.
기사 내용은 저자에 의해 삭제되어 해당 기법에 대한 실질적인 정보가 남아 있지 않습니다.
비프로그래머가 128GB 통합 메모리가 탑재된 MacBook M5 Max에서 로컬 대규모 언어 모델 인프라를 설정하는 경험을 공유합니다. 사용자는 학습을 위한 소프트웨어 스택, 모델 선택, 안정적이고 원격으로 접근 가능한 시스템을 구축하면서 AI를 배우기 위한 목표를 자세히 설명합니다.
Together AI는 플랫폼 개발의 풀 스택을 아우르는 9편의 논문을 ICML 2026에서 발표합니다.
동사는 오픈소스 인공지능으로의 전환을 가속화하기 위해 시리즈 C 자금 조달에서 8억 달러를 조달했습니다.
본 기사는 엔터프라이즈 Java 애플리케이션을 다른 프레임워크 간에 마이그레이션하는 동안 AI 에이전트의 성능을 평가하도록 설계된 벤치마크인 ScarfBench를 소개합니다. 이 연구는 프레임워크 마이그레이션의 복잡성을 강조하고 이 영역에서 에이전트 능력을 평가하기 위한 표준화된 평가 방법을 제안합니다.
crewAI 1.15.2a1 릴리스는 에이전트 오케스트레이션 프레임워크를 위해 여러 새로운 기능, 버그 수정 및 문서 업데이트를 도입합니다.
llama.cpp b9857 릴리스는 Hexagon Flash Attention 구현의 포괄적인 재구현을 도입하여 최적화와 정확도 개선을 중점적으로 다룹니다. 이 업데이트에는 hex-mm 및 hex-fa 모듈에 대한 주요 변경 사항이 포함되어 있으며, 여기에는 양자화 작업을 주 matmul 스레드에 병합하고 ADD 연산과 융합하며 마스크 처리를 최적화하는 작업이 포함됩니다.
llama.cpp 프로젝트가 버전을 b9855로 출시했으며, 이는 ggml-cpu 백엔드 내에서 UE4M3 룩업 테이블(LUT)을 사용하여 nvfp4 곱셈-누적 연산에 대한 AVX2 최적화를 도입합니다.
llama.cpp 프로젝트가 CUDA에서 Flash Attention에 대한 `restrict` 키워드와 PDL의 일관된 사용을 도입한 버전 b9856을 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에 대해 macOS, Linux, Android, Windows 및 openEuler용 사전 빌드 바이너리를 동반합니다.
이번 업데이트는 Progressive Web App (PWA) 내비게이션 폴백 메커니즘을 제거합니다. 이 변경은 API 엔드포인트 요청이 의도치 않게 캐싱되는 것을 방지하기 위해 특별히 구현되었습니다.
llama.cpp 프로젝트가 버전 b9852를 출시하여 q1_0 양자화 형식에 대한 초기 OpenCL 지원을 도입했습니다. 이번 업데이트에는 일반적인 q1_0 기능과 OpenCL 장치용 Adreno GEMM/GEMV 구현이 포함됩니다.
Anthropic은 미국 정부가 모든 사용자의 가용성을 중단시켰던 수출 통제를 해제함에 따라 Claude Fable 5 및 Mythos 5 모델에 대한 글로벌 접근을 복원하고 있습니다. Fable 5는 7월 1일부터 Claude 플랫폼에서 전 세계적으로 이용 가능해지며, 7월 7일까지 사용 제한이 적용된 후 크레딧 기반 액세스 방식으로 전환됩니다.
llama.cpp 프로젝트는 flash_attn_mask_to_KV_max 커널에서 정수 절단 및 오버플로 오류를 방지하기 위한 CUDA 수정 사항을 포함하는 버전 b9851을 출시했습니다. 이 업데이트는 지정된 커널 내의 KQ 마스크 스트라이드와 관련된 문제를 해결합니다.
llama.cpp b9850 릴리스는 특정 모델 지원 업데이트를 도입하며, 여기에는 Qwen3Next에 대한 t_layer_inp 텐서 등록, 레이어 처리 루프 내 입력 할당 수정, qwen-coder-next에 대한 DFLASH 문제 해결이 포함됩니다. 또한 Qwen3 모델의 어텐션 정규화를 위한 텐서를 추가합니다.
Model Context Protocol (MCP) Python SDK가 2026-07-28 MCP 사양을 완전히 지원하는 첫 번째 베타 버전인 v2.0.0b1을 출시했습니다. 이 프리릴리스는 옵트인 방식만 지원하므로, 표준 설치에서는 안정적인 1.x 라인으로 계속 해결됩니다.
Microsoft Research는 SkillOpt를 소개합니다. 이는 에이전트 스킬 파일을 동결된 대상 모델 외부의 학습 가능한 파라미터로 취급하여, 수동 스킬 편집을 제어된 최적화 프로세스로 전환하는 방법입니다. 이 접근 방식은 기본 모델 가중치를 업데이트하지 않고도 에이전트의 신뢰성과 일관성을 향상시킵니다.
Anthropic은 파편화된 과학적 도구를 단일 연구 환경으로 통합하도록 설계된 AI 작업대인 Claude Science를 베타로 출시했습니다. 이 플랫폼은 감사 가능한 아티팩트, 유연한 컴퓨팅 확장성, 그리고 유전체학 및 구조생물학과 같은 도메인을 위한 전문 에이전트를 제공하여 발견을 가속화하는 것을 목표로 합니다.
Anthropic은 Claude Sonnet 5를 출시했습니다. 이는 이전의 Opus 클래스 모델보다 낮은 비용으로 복잡한 계획, 도구 사용 및 자율적 코딩 작업을 수행하도록 설계된 새로운 에이전트형 AI 모델입니다. 이번 업데이트는 Sonnet 4.6 대비 추론, 안전성, 실행 측면에서 상당한 개선을 제공하면서도 Opus 4.8과의 성능 격차를 좁혔습니다.
Anthropic은 기본 모델을 Claude Sonnet 5로 업데이트한 Claude Code 버전 2.1.197을 출시했습니다. 이 새로운 모델은 네이티브 1M 토큰 컨텍스트 윈도우를 특징으로 하며, 8월 31일까지 프로모션 가격으로 제공됩니다.
GeneBench-Pro는 복잡한 유전체 추론 작업을 위해 모델을 평가하도록 설계된 벤치마크로, 대표적인 질문과 지원 자료를 보여주는 10개의 상세한 사례 연구를 특징으로 합니다. 각 사례 연구는 특정 생물학적 과제에 대한 모델 성능을 평가하는 데 필요한 원래 프롬프트, 데이터셋 및 컨텍스트를 제공합니다.