llama.cpp가 b9782를 새로운 바이너리와 지원과 함께 출시
llama.cpp는 macOS, Linux, Android, Windows, openEuler용 바이너리를 포함하는 버전 b9782를 출시했습니다. 이번 릴리스는 여러 아키텍처 전반에 Vulkan, OpenVINO, SYCL, ROCm, CUDA 지원을 추가했으며, KleidiAI 및 openEuler 지원과 같은 기능이 비활성화된 업데이트된 UI를 제공합니다.
llama.cpp는 macOS, Linux, Android, Windows, openEuler용 바이너리를 포함하는 버전 b9782를 출시했습니다. 이번 릴리스는 여러 아키텍처 전반에 Vulkan, OpenVINO, SYCL, ROCm, CUDA 지원을 추가했으며, KleidiAI 및 openEuler 지원과 같은 기능이 비활성화된 업데이트된 UI를 제공합니다.
구글은 Gemini 3.5 Flash에서 컴퓨터 사용 기능을 도입하여 모델이 코드를 실행하고 외부 도구와 상호작용할 수 있도록 했습니다. 이 기능을 통해 사용자는 프로그래밍 작업을 실행하고 통합 컴퓨팅 기능을 통해 실시간 정보에 접근할 수 있습니다.
FFASR 리더보드는 현실 세계 조건에서 음성 인식 시스템을 평가하기 위해 출시되었습니다. 이는 다양한 환경과 사용 사례에 걸쳐 자동 음성 인식 모델의 성능을 평가하기 위한 벤치마크를 제공합니다.
NVIDIA의 NeMo AutoModel은 모델 선택과 최적화를 자동화하여 트랜스포머 모델의 파인튜닝을 더 빠르게 수행할 수 있게 합니다. 이는 개발 시간을 줄이고 NVIDIA 하드웨어에서 대규모 언어 모델을 훈련하는 효율성을 향상시킵니다.
버전 2.1.190에는 버그 수정과 신뢰성 개선이 포함되었습니다. 이번 업데이트에서는 새로운 기능이 발표되지 않았습니다.
llama.cpp는 Linux와 Windows에서 Vulkan 지원을 추가하고 macOS, Linux, Android, Windows를 아우르는 ARM64 및 x64를 포함한 여러 아키텍처로 확장된 버전 b9781을 출시했습니다. 이번 릴리스에는 CPU, CUDA, OpenVINO, SYCL, ROCm 빌드가 포함되며 UI 컴포넌트도 제공됩니다.
Mistral Studio는 이제 워크스페이스 및 도구별로 커넥터 접근을 관리하기 위한 강화된 관리자 제어 기능을 제공합니다. 이를 통해 세분화된 권한 설정이 가능해집니다. 주요 기능으로는 범위(scope)가 적용된 API 키, 다중 계정 커넥터, 그리고 근본 원인 분석을 위한 새로운 커넥터 디버거가 있으며, 모두 엔터프라이즈 시스템과의 안전하고 감사 가능한 통합을 지원합니다.
Talos는 희귀 질환 진단을 위해 유전체 데이터의 반복적 재분석을 자동화하는 오픈소스 도구입니다. 이 도구는 환자당 평균 1.3개의 후보 변이만으로도 대상 내 진단의 90%를 복원했으며, 진단받지 못한 5,000명의 환자들 사이에서 241건의 새로운 진단을 제공했습니다. 대부분의 새로운 발견은 증거가 출판된 지 32일 이내에 나타났습니다.
Aiden은 HDMI를 통해 전화기의 화면을 모니터링하고 USB HID를 통해 제어하는 물리적 AI 에이전트 장치로, 탈옥이나 설치된 소프트웨어 없이 앱 자동화를 가능하게 합니다. 자체 LLM을 지원하며 백엔드 인프라나 데이터 수집 없이 작동하고 AGPL 라이선스 하에 오픈소스 개발 보드로 출시되었습니다.
OpenAI와 Broadcom는 대규모 언어 모델 추론을 위해 설계된 맞춤형 AI 칩인 Jalapeño를 출시했습니다. 이 칩은 AI 시스템의 성능, 효율성 및 확장성을 향상시키는 것을 목표로 합니다.
vulkan-shaders-gen 도구는 이제 셰이더 컴파일이 실패할 경우 빌드를 감지하고 실패시켜 손상된 libggml-vulkan 생성을 방지합니다. 이 수정은 빌드 성공이 런타임 실패를 가렸던 기존 문제를 해결하며, 플랫폼 전반에 걸친 오류 처리 및 원자 플래그 관리 개선 사항을 포함합니다.
LLaMA.cpp b9777 릴리스는 LFM2.5-ColBERT-350M 및 LFM2.5-Embedding-350M 모델을 추가합니다. 이번 릴리스에는 macOS, Linux, Android, Windows, openEuler용 사전 빌드 바이너리가 포함되어 있으며, CUDA, Vulkan, OpenVINO, SYCL 등 다양한 아키텍처와 가속 기술을 지원합니다.
vllm이 v0.24.0rc1을 출시했으며, 여기에는 SM75에서의 topk 히스토그램 빌드 문제 해결이 포함됩니다. 이 변경사항은 커밋 191826e에서 cherry-pick되었으며 Mohammad Miadh Angkad가 승인했습니다.
200줄짜리 Go 튜토리얼은 Go의 동시성과 간결성을 사용하여 경량 모델 컨텍스트 프로토콜 서버를 구축하는 방법을 보여줍니다. 이 서버는 Claude와 같은 AI 에이전트가 구조화된 데이터와 Go 애플리케이션에 접근할 수 있게 하여, 잠재적으로 10배 더 유용하게 만듭니다.
한 사용자가 VRAM 12GB 내에서 작동하며 MCP와 연동되는 Unity 6.5에 맞춰진 경량 LLM을 찾고 있습니다. 현재 Cursor와 Claude의 무료 티어를 사용하고 있지만 충분하지 않다고 판단하여, 전용 모델이나 대안이 있는지 묻고 있습니다.
사용자는 wav2vec2-base 또는 wavlm-base-plus를 3클래스 오디오 분류를 위해 파인튜닝한 결과 우연 수준과 일치하는 33%의 정확도만 달성했다고 보고합니다. 모델은 분류 헤드만 업데이트하고, 어텐션 마스크 없이 길이가 1.0초인 패딩된 클립을 사용하며, 학습률은 1e-3으로 설정되어 클래스 불균형과 짧은 입력 클립에도 불구하고 성능이 낮습니다.
openai-agents-python 라이브러리 버전 0.17.7에는 구성 가능한 WebSocket 최대 크기와 버퍼링된 Chat Completions 도구 호출 스트리밍과 같은 새로운 기능이 포함되었습니다. 또한 샌드박스 버퍼링, 오류 처리, 도구 디스패치 관련 여러 문제 수정과 문서 업데이트, 개선된 오류 메시지가 포함되어 있습니다.
llama.cpp 버전 b9776은 macOS, Linux, Android, Windows 전반에 걸쳐 CPU, OpenCL, CUDA, SYCL 변형과 함께 Linux와 Windows용 Vulkan 지원을 도입합니다. 이 릴리스는 또한 OpenVINO와 ROCm에 대한 지원을 포함하며, UI는 별도 패키지로 제공됩니다.
CrewAI 1.14.8a3 은 통합 선언적 흐름 로딩과 크루 실행을 위한 개선된 시작 UX 를 도입합니다. 이는 crewai run 및 flow kickoff 명령을 통합하고, 선언적 Flow CLI 지원을 추가하며, 도구용 타입 출력 스키마가 있는 @router() 를 흐름 시작 메소드로 활성화합니다.
Claude v2.1.187는 샌드박스 자격 증명 차단, 조직 구성 모델 제한, 전체 화면에서 마우스 클릭 지원, 명령 실패/도구 멈춤/UI 안정성 관련 수정 사항을 도입합니다. 업데이트는 구조화된 출력 처리, 에이전트 깊이 추적, 플러그인 관리를 개선하며 VSCode 및 터미널 호환성도 강화됩니다.