llama.cpp b9847 릴리스, Gemma E4B MTP FlashAttention 수정
llama.cpp 프로젝트가 버전 b9847을 출시했으며, 여기에는 CUDA에서의 Gemma E4B MTP FlashAttention 수정과 사용하지 않는 템플릿 선언 제거가 포함됩니다.
llama.cpp 프로젝트가 버전 b9847을 출시했으며, 여기에는 CUDA에서의 Gemma E4B MTP FlashAttention 수정과 사용하지 않는 템플릿 선언 제거가 포함됩니다.
저자는 Hugging Face Hub의 LeRobotDataset 카테고리를 위한 오픈소스 린터인 Trajlens를 소개하고, 'lerobot' 태그가 붙은 100개의 무작위 공개 데이터셋에 대한 감사 결과를 보고합니다. 감사는 검증에 통과한 데이터셋이 단 19개였으며, 13개가 특정 상류 버그로 인해 실패하고 47개가 로드 오류 또는 시간 초과를 겪었음을 밝혔습니다.
기능 요청은 기관의 합의를 반영하는 시스템에서 분산된 다중 관점 검증 엔진으로 AI를 변환하도록 설계된 아키텍처인 인식론적 적대적 네트워크(EAN)를 제안합니다. 이 접근 방식은 단일 "진실의 원천" 모델을 제거함으로써 정치적 및 기업적 권력 게임을 제거하는 것을 목표로 합니다.
Hugging Face 포럼의 토론 스레드는 사용자가 현재 챗봇 개발에 사용하는 무료 또는 오픈소스 AI 모델과 선호하는 이유를 묻고 있습니다.
Hugging Face 포럼의 한 사용자가 복잡한 주제에 대해 추론할 수 있는 무검열 AI 모델에 대한 추천을 구하고 있으며, 현재 버전보다 GPT-4의 초기 버전을 선호한다고 인용했습니다.
llama.cpp 프로젝트는 Asahi Linux를 위한 Vulkan 백엔드 최적화를 포함하는 버전 b9846을 출시했습니다. 이 업데이트는 리눅스에서 실행 중인 Apple Silicon 하드웨어의 호환성과 성능을 개선하기 위해 행렬 곱의 블록 크기 루프를 롤백합니다.
llama.cpp 프로젝트는 NVFP4 양자화 형식에 대한 ggml-webgpu 지원을 도입한 버전 b9844를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, iOS, Linux, Android, Windows 및 openEuler용 사전 빌드된 바이너리도 제공합니다.
AgentSeal v5 감사 도구는 잠재적 오염 위험을 평가하기 위해 SWE-bench Pro 벤치마크의 아티팩트 공개 가용성을 평가했습니다. 연구 결과, 12개의 인스턴스가 결정론적 콘텐츠 중복을 보였고 76개 저장소가 코퍼스 구성원일 가능성이 있었으나, 대부분의 증거는 차단 이전의 오염 입증보다는 날짜 미상의 공개 복제본이었습니다.
Google UK는 국가에서 더 많은 사람들이 AI 기반 기술의 혜택을 활용할 수 있도록 돕는 전략을 상세히 담은 최신 경제 영향 보고서를 발표했습니다.
llama.cpp 프로젝트는 macOS, Linux, Android, Windows, openEuler의 다양한 하드웨어 아키텍처를 위한 사전 빌드된 바이너리를 제공하는 b9843 릴리스를 게시했습니다.
LangGraph 버전 1.2.7이 출시되었으며, LangChain 생태계를 위한 버그 수정 및 의존성 업데이트가 포함되었습니다.
트랜스포머의 내부 작동 방식을 상세히 설명하는 영어와 스페인어로 된 오픈소스 양국어 가이드가 출판되었습니다. 이 자료는 어텐션 콜랩스와 KV-캐시 압축 뒤에 있는 정확한 수학과 메커니즘을 다룹니다.
독립 연구 프로젝트 LIMEN은 7개의 오픈소스 Transformer 모델의 내부 역학을 분석하여 의미적 모호성이 궤적 기하학을 변경하고 아키텍처 전반에 걸쳐 보편적인 동적 문법을 발견했습니다.
Microsoft Research는 장기 AI 작업에서 추상화와 구체성의 균형을 맞추도록 설계된 확장 가능한 에이전트 메모리 프레임워크인 Memora를 소개합니다. 이 시스템은 풍부한 메모리 내용을 경량 검색 구조와 분리하여, 컨텍스트 토큰을 최대 98%까지 줄이면서 벤치마크에서 새로운 최첨단 결과를 달성했습니다.
Claude Code 버전 2.1.196은 조직 기본 모델, 클릭 가능한 파일 첨부, MCP 서버 승인에 대한 보안 강화를 도입합니다. 이 업데이트는 백그라운드 세션의 신뢰성을 향상시키고, 다양한 에이전트 상태 보고 문제를 수정하며, 코드 검토 워크플로우에서 토큰 사용을 최적화합니다.
본 글은 다양한 데이터 분포에서 밀도 추정과 점수 기반 생성 작업을 모두 수행할 수 있는 통합 트랜스포머 모델인 DiScoFormer를 소개합니다.
프로젝트 UCTF는 단일 제안에서 다국어 AI 학습에서의 교차 언어 의미적 중복성을 줄일 수 있는지 조사하기 위한 개방적이고 가설 기반의 연구 프로그램으로 재구성되었습니다.
한 사용자가 Hugging Face에서 딥 RL 과정의 수료증을 생성하려고 할 때 오류가 발생했다고 보고했습니다. 필요한 사용자 이름과 이름 세부 정보를 입력했음에도 문제가 지속되며, 온라인에서 기존 가이드를 찾을 수 없습니다.
구글 전문가가 인공지능에 대한 풀스택 접근 방식의 개념을 설명합니다. 이 기사는 이러한 포괄적인 방법론이 구글의 AI 작업을 오랫동안 뒷받침해 왔다고 강조합니다.
llama.cpp b9842 릴리스는 /v1/models 엔드포인트에서 프리셋 및 캐시된 모델 엔트리의 중복을 제거하는 변경 사항을 도입합니다. 이 업데이트는 Hugging Face의 Adrien Gallouët이 승인했습니다.