전체 기사 — korshunov.ai

전체 기사 페이지 1 / 19

Context Gravity

Chris Diaz가 현재 GitHub에서 사용할 수 있는 Context Gravity라는 새로운 프로젝트를 공유했습니다. 작성자는 저장소에 대한 커뮤니티 피드백을 구하고 있습니다.

Prism Transformer: 계층적 어텐션 처리를 위한 점진적 헤드 스케줄

Prism Transformer는 레이어 간 어텐션 헤드 수를 가변적으로 조절하는 점진적 헤드 스케줄을 도입합니다. 이는 초기 레이어에서 적고 넓은 헤드로 시작하여 깊이에 따라 단조 증가시킵니다. 이 접근 방식은 아키텍처 오버헤드를 추가하지 않고 초기와 후기 레이어의 구조적 필요를 해결함으로써 표준 균일 할당에 도전합니다.

github CrewAI · 14시간 전

LangChain v1.15.2a2 릴리스 노트

이번 릴리스는 Bedrock 통합, 흐름 에이전트 문서화, 스트리밍 탐색의 새로운 기능과 버그 수정 및 문서 개선을 포함합니다.

media Hugging Face Forums · 15시간 전

프랙탈 드리밍 + 양자 영감 계획: DeepSeek Coder을 사용한 자기 조직화 지식 발견 도구

저자는 프랙탈 패턴 생성과 양자 영감 중첩을 통합하여 DeepSeek Coder의 지식 공간 탐색을 강화하는 자기 조직화 지식 발견 도구를 제시합니다. 이 시스템은 성공적인 창의적 경로를 메모리가 아닌 캐시된 쿼리로 저장하여 검색 궤적을 최적화하고, 하드웨어 제약에 따라 리소스 사용을 적응시킵니다.

media Hugging Face Forums · 15시간 전

Wmf - 새로운 실험적 기법

기사 내용은 저자에 의해 삭제되어 해당 기법에 대한 실질적인 정보가 남아 있지 않습니다.

media Hugging Face Forums · 15시간 전

MacBook M5 Pro에서의 로컬 LLM - 이 분야 완전 초보자!

비프로그래머가 128GB 통합 메모리가 탑재된 MacBook M5 Max에서 로컬 대규모 언어 모델 인프라를 설정하는 경험을 공유합니다. 사용자는 학습을 위한 소프트웨어 스택, 모델 선택, 안정적이고 원격으로 접근 가능한 시스템을 구축하면서 AI를 배우기 위한 목표를 자세히 설명합니다.

media Together AI Blog · 16시간 전

ICML 2026의 Together AI: 풀 스택에 걸친 프론티어 연구

Together AI는 플랫폼 개발의 풀 스택을 아우르는 9편의 논문을 ICML 2026에서 발표합니다.

lab Hugging Face Blog · 16시간 전

Hugging Face와 Cerebras가 Gemma 4를 실시간 음성 AI에 도입

Hugging Face와 Cerebras는 Google의 Gemma 4 모델을 자체 플랫폼에 통합하여 실시간 음성 인공지능 애플리케이션을 가능하게 했습니다. 이 협력을 통해 개발자는 낮은 지연 시간 오디오 처리 작업을 위해 Gemma 4의 멀티모달 기능을 활용할 수 있습니다.

media Together AI Blog · 16시간 전

오픈소스 AI로의 전환 가속화를 위한 8억 달러 시리즈 C 자금 조달 발표

동사는 오픈소스 인공지능으로의 전환을 가속화하기 위해 시리즈 C 자금 조달에서 8억 달러를 조달했습니다.

lab Hugging Face Blog · 16시간 전

ScarfBench: 엔터프라이즈 Java 프레임워크 마이그레이션을 위한 AI 에이전트 벤치마킹

본 기사는 엔터프라이즈 Java 애플리케이션을 다른 프레임워크 간에 마이그레이션하는 동안 AI 에이전트의 성능을 평가하도록 설계된 벤치마크인 ScarfBench를 소개합니다. 이 연구는 프레임워크 마이그레이션의 복잡성을 강조하고 이 영역에서 에이전트 능력을 평가하기 위한 표준화된 평가 방법을 제안합니다.

github CrewAI · 18시간 전

crewAI 1.15.2a1 릴리스 노트

crewAI 1.15.2a1 릴리스는 에이전트 오케스트레이션 프레임워크를 위해 여러 새로운 기능, 버그 수정 및 문서 업데이트를 도입합니다.

lab Claude Code Releases · 20시간 전

Claude Code v2.1.198 릴리스 노트

Claude Code의 v2.1.198 업데이트는 Chrome에서 Claude의 일반 출시를 도입하고 새로운 알림 후크와 자동 PR 워크플로우를 통해 백그라운드 에이전트 기능을 강화합니다.

lab Google — The Keyword (AI) · 21시간 전

NYC 교육자 및 업계 리더들이 Google에서 모여 교실의 AI를 형성하다

Google, 뉴욕 주지사 CEO 이사회, Urban Assembly는 Google 사무실에서 교육 및 업계 리더 150명을 대상으로 AI 정상회담을 개최했습니다. 이 행사는 교실 환경 내에서 인공지능 통합의 미래를 논의하고 형성하기 위해 이해관계자들을 모았습니다.

lab Google — The Keyword (AI) · 21시간 전

구글의 최신 AI 뉴스, 2026년 6월 발표

이 기사는 2026년 6월 구글이 발표한 인공지능 업데이트 및 발표 내용을 요약한 것입니다.

github llama.cpp · 22시간 전

llama.cpp b9859 릴리스에 OpenCL 사전 컴파일된 커널 지원 추가

llama.cpp b9859 릴리스는 OpenCL을 위해 라이브러리에서 사전 컴파일된 바이너리 커널을 로드할 수 있는 기능을 도입했으며, 특히 Adreno GPU를 대상으로 합니다. 이 업데이트는 CPU, GPU 및 다양한 가속기 백엔드에 대해 macOS, Linux, Windows, Android, openEuler에 대한 바이너리도 제공합니다.

lab xAI News · 23시간 전

xAI, Grok Voice용 노코드 음성 에이전트 빌러 출시

xAI는 Grok Voice에서 2분 이내에 프로덕션 등급의 음성 에이전트를 구성할 수 있는 노코드 플랫폼인 Voice Agent Builder의 베타 버전을 발표했습니다. 이 도구를 사용하면 운영자 및 개발자가 기반이 되는 전화망이나 AI 스택을 처음부터 구축하지 않고도 고부하 음성 에이전트를 배포할 수 있습니다.

github llama.cpp · 23시간 전

HF 모델 경로 수정이 포함된 llama.cpp b9858 릴리스

llama.cpp 프로젝트는 Hugging Face 기본 분할을 모델 경로로 사용하도록 변경한 버전 b9858을 출시했습니다. 이 업데이트는 모델 로드 경로와 관련된 이슈 #25181을 해결합니다.

github llama.cpp · 1일 전

llama.cpp b9857 릴리스: Flash Attention 재구현 및 새로운 바이너리

llama.cpp b9857 릴리스는 Hexagon Flash Attention 구현의 포괄적인 재구현을 도입하여 최적화와 정확도 개선을 중점적으로 다룹니다. 이 업데이트에는 hex-mm 및 hex-fa 모듈에 대한 주요 변경 사항이 포함되어 있으며, 여기에는 양자화 작업을 주 matmul 스레드에 병합하고 ADD 연산과 융합하며 마스크 처리를 최적화하는 작업이 포함됩니다.

github llama.cpp · 1일 전

llama.cpp b9855 릴리스, AVX2 nvfp4 최적화 및 새 바이너리 추가

llama.cpp 프로젝트가 버전을 b9855로 출시했으며, 이는 ggml-cpu 백엔드 내에서 UE4M3 룩업 테이블(LUT)을 사용하여 nvfp4 곱셈-누적 연산에 대한 AVX2 최적화를 도입합니다.

github llama.cpp · 1일 전

CUDA 제한 + FA용 PDL을 포함한 llama.cpp b9856 릴리스

llama.cpp 프로젝트가 CUDA에서 Flash Attention에 대한 `restrict` 키워드와 PDL의 일관된 사용을 도입한 버전 b9856을 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에 대해 macOS, Linux, Android, Windows 및 openEuler용 사전 빌드 바이너리를 동반합니다.