전체 기사
media Hugging Face Forums · 3일 전

세대 간 컨텍스트 아키텍처: LLM 컨텍스트 부패 해결

세대 간 컨텍스트 아키텍처(GCA)는 멀티 에이전트 시스템에서 "컨텍스트 부패"와 주의력 희석을 해결하기 위해 LLM의 컨텍스트 창을 무한 저장소가 아닌 유한한 수명으로 취급할 것을 제안합니다. 인공적인 사망을 강제함으로써 성능이 저하되기 전에 에이전트를 종료하고, 평면 파일 Markdown vault를 통해 상태를 새 세대에 전달합니다.

media Hugging Face Forums · 4일 전

소형 언어 모델 내부의 기능적 영역 탐색

이 독립 연구 프로젝트는 표준 출력 벤치마크에 의존하는 대신 추론 동안 숨겨진 표현이 어떻게 진화하는지를 분석하여 일곱 개의 소형 및 중형 언어 모델의 내부 역학을 특징짓습니다. 이 연구는 서로 다른 아키텍처 전반에서 재현 가능한 패턴을 식별하기 위해 동적 행동, 기능적 조직화 및 표현 기하학을 조사합니다.

media Hugging Face Forums · 4일 전

트랜스포머를 위한 포괄적인 양국어 가이드: 기초부터 KV 캐시 압축 및 어텐션 역학까지

Carles Marin은 트랜스포머 아키텍처의 수학적 기초와 실제 구현을 연결하는 오픈소스 양국어(영어 및 스페인어) 가이드를 출시했습니다. 이 리소스는 저수준 메커니즘에 중점을 두고 복잡한 주제를 설명하기 위해 재현 가능한 코드와 상호작용 요소를 제공합니다.

lab OpenAI News · 4일 전

HP Inc., OpenAI와 프론티어 전략적 파트너십 발표

HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.

github llama.cpp · 4일 전

llama.cpp b9837 릴리즈에 --reasoning-preserve 플래그 및 새 바이너리 추가

llama.cpp 프로젝트는 추론 토큰을 유지하기 위해 Jinja 채팅 템플릿용 새로운 `--reasoning-preserve` 플래그를 도입한 버전 b9837을 출시했습니다. 이 업데이트에는 수정된 도움말 메시지가 포함되어 있으며, 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler 에 대한 사전 빌드된 바이너리를 제공합니다.

media Hugging Face Forums · 4일 전

HoLo-ToLk: 0-파라미터 HSL 기판 위의 토크나이저 없는 음성 모델

저자는 토크나이저나 학습된 입력 임베딩 없이 0-파라미터 HSL 바이트 기판을 사용하여 음성-텍스트(STT) 및 텍스트-음성(TTS) 모델을 구축하는 연구 프로젝트인 HoLo-ToLk를 소개합니다. 이 작업은 특정 아키텍처 수정과 결합할 때 원시 HSL 바이트가 오디오 처리에 실행 가능한 신호로 사용될 수 있음을 보여줍니다.