전체 기사
media Hugging Face Forums · 3일 전

세대 간 컨텍스트 아키텍처: LLM 컨텍스트 부패 해결

세대 간 컨텍스트 아키텍처(GCA)는 멀티 에이전트 시스템에서 "컨텍스트 부패"와 주의력 희석을 해결하기 위해 LLM의 컨텍스트 창을 무한 저장소가 아닌 유한한 수명으로 취급할 것을 제안합니다. 인공적인 사망을 강제함으로써 성능이 저하되기 전에 에이전트를 종료하고, 평면 파일 Markdown vault를 통해 상태를 새 세대에 전달합니다.

lab OpenAI News · 3일 전

HP Inc., OpenAI와 프론티어 전략적 파트너십 발표

HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.

github llama.cpp · 3일 전

llama.cpp b9837 릴리즈에 --reasoning-preserve 플래그 및 새 바이너리 추가

llama.cpp 프로젝트는 추론 토큰을 유지하기 위해 Jinja 채팅 템플릿용 새로운 `--reasoning-preserve` 플래그를 도입한 버전 b9837을 출시했습니다. 이 업데이트에는 수정된 도움말 메시지가 포함되어 있으며, 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler 에 대한 사전 빌드된 바이너리를 제공합니다.

media Hugging Face Forums · 3일 전

HoLo-ToLk: 0-파라미터 HSL 기판 위의 토크나이저 없는 음성 모델

저자는 토크나이저나 학습된 입력 임베딩 없이 0-파라미터 HSL 바이트 기판을 사용하여 음성-텍스트(STT) 및 텍스트-음성(TTS) 모델을 구축하는 연구 프로젝트인 HoLo-ToLk를 소개합니다. 이 작업은 특정 아키텍처 수정과 결합할 때 원시 HSL 바이트가 오디오 처리에 실행 가능한 신호로 사용될 수 있음을 보여줍니다.

github llama.cpp · 4일 전

llama.cpp b9830 릴리스는 --offline 플래그를 추가하고 메모리 버그를 수정함

llama.cpp b9830 릴리스는 llama download 명령어와 함께 --offline 플래그를 사용할 수 있는 기능을 도입하여, 스크립트가 네트워크 접근 없이 캐시된 모델을 확인할 수 있게 합니다. 이 업데이트는 URL 작업의 on_done 콜백에서 first_path가 참조로 잘못 캡처되어 발생했던 잠재적인 use-after-free 취약점도 해결합니다.