전체 기사 — korshunov.ai

전체 기사 페이지 1 / 22

DGX Spark와 Strix Halo를 사용한 분리형 프롬프트 처리

한 사용자가 DGX Spark를 사전 채우기(prefilling)에, Strix Halo 장치를 토큰 생성에 사용하여 분리형 추론 파이프라인을 구현했으며, 긴 컨텍스트 워크로드에서 상당한 속도 향상을 달성했습니다. 계산 집약적인 프롬프트 처리를 DGX로 오프로드하고 Strix의 메모리 대역폭을 디코딩에 활용함으로써, Strix 단독 실행 시 발생하는 성능 저하를 극복했습니다.

media r/LocalLLaMA · 15시간 전

에이전트들이 LLM을 위한 강화 학습에 대한 방대한 위키를 공동으로 작성 중 (지금까지 200개 이상의 논문), 누구나 참여 가능

AI 에이전트가 대규모 언어 모델을 위한 강화 학습에 대한 포괄적인 위키를 컴파일하고 있는 협력 프로젝트가 진행 중이며, 이미 200편 이상의 연구 논문을 처리했습니다.

media r/LocalLLaMA · 15시간 전

오픈 소스 개발자에 대한 감사를 촉구하는 레딧 게시물

한 레딧 사용자는 커뮤니티 노력의 훌륭한 예로 최근 vLLM의 빠른 업데이트를 인용하며 오픈 소스 기여자에 대한 감사의 중요성을 강조합니다.

media r/LocalLLaMA · 15시간 전

Gemma 4 31b 재구축 중... 더 나은 성능으로... 26b로...

한 개발자가 파라미터 수를 약 26B로 줄이면서 성능 향상을 목표로 Gemma 4 31B 모델을 재구축하는 계획을 밝혔습니다. 이 프로젝트에는 아키텍처 변경, 특정 훈련 기법, 데이터셋 큐레이션이 포함되어 더 작고 효율적인 모델을 만드는 것을 목표로 합니다.

media r/LocalLLaMA · 15시간 전

poolside/Laguna-XS-2.1

본 기사는 Hugging Face의 poolside 조직 아래에서 사용할 수 있는 모델 Laguna-XS-2.1의 출시를 발표합니다.

media r/LocalLLaMA · 15시간 전

Kimi K2.7 Code가 GitHub Copilot에서 일반 제공 시작

Moonshot AI의 Kimi K2.7 Code 모델이 GitHub Copilot 플랫폼 내에서 일반적으로 사용 가능해졌습니다.

media r/LocalLLaMA · 17시간 전

레딧 사용자가 Ubuntu가 로컬 AI용 가장 호환성 있는 Linux 배포판인지 묻다

r/LocalLLaMA 커뮤니티의 레딧 사용자가 Linux로 전환하고 있으며, 로컬 AI 워크로드 실행을 위해 Ubuntu가 최고의 호환성을 제공하는지 확인하려고 합니다.

media Hugging Face Forums · 17시간 전

웹사이트 다운로드에서의 유니코드 문자 지원

Hugging Face 웹사이트는 다운로드 버튼이나 resolve URL을 통해 데이터셋에서 개별 파일을 다운로드할 때 유니코드 문자를 올바르게 인코딩하지 않습니다.

media Hugging Face Forums · 17시간 전

LLM 에이전트는 예지력을 발전시킬 수 있는가?

본 기사는 현재 LLM 에이전트가 암묵적인 결과 인식을 가지고 행동하는 경우가 많으며, 이는 결과적 작업에 충분하지 않다고 주장합니다. 에이전트가 실행 전에 위험을 모델링하고 영향을 예측할 수 있도록 하기 위해 '명시적 예지'가 필요한 아키텍처 레이어로 제안됩니다.

media Hugging Face Forums · 17시간 전

고객 지원 에이전트에 가장 적합한 오픈소스 모델은 무엇인가요?

Hugging Face 포럼의 한 사용자가 AI 고객 지원 챗봇 또는 가상 비서를 구축하기 위한 무료 AI 모델 중 최선의 선택이 무엇인지 질문하고 있습니다. 해당 게시글에는 특정 모델 비교, 테스트 결과 또는 기술적 세부 사항이 포함되어 있지 않습니다.

media Hugging Face Forums · 17시간 전

Hugging Face 모델의 다운로드 카운터 오류

Hugging Face 커뮤니티 포럼의 한 사용자가 2일 전에 업로드되었음에도 불구하고 자신의 모델 저장소 InternScience/Agents-A1-FP8 의 다운로드 통계가 0으로 유지되고 있다고 보고했습니다. 사용자는 저장소에 config.json 파일이 포함되어 있으며 카운터가 업데이트되지 않는 기술적 문제가 있다고 의심합니다.

media Hugging Face Forums · 17시간 전

Hugging Face 청구 지원의 지연된 응답에 대한 사용자 보고서

Hugging Face 토론 포럼의 한 사용자가 무단 구독과 관련된 청구 지원팀으로 보낸 이메일에 대한 응답을 받지 못했다고 보고했습니다. 해당 사용자는 실수로 부과된 요금에 대한 환불을 요청하며, 이미 지원 팀에 연락했음에도 불구하고 소통이 이루어지지 않고 있다고 지적했습니다.

media Hugging Face Forums · 17시간 전

데이터셋 변경 사항 감지 및 가져오기를 위한 모범 사례

Hugging Face 포럼의 한 사용자는 새 데이터가 추가되거나 데이터셋이 업데이트될 때 감지하고 전체 데이터셋을 다시 처리하지 않고 파이프라인을 트리거하기 위한 효율적인 방법을 요청했습니다.

media r/LocalLLaMA · 17시간 전

PrismML의 1비트 Bonsai-8B가 구문을 사용한 CPU 도구 호출에서 IBM Granite를 제압

PrismML의 1비트 Bonsai-8B 모델과 IBM의 Granite 및 기타 LLM을 비교한 벤치마크 결과, Bonsai-8B는 구문 제약 디코딩을 사용할 때 가장 높은 도구 호출 정확도를 달성했습니다. llama.cpp를 사용하여 CPU에서 수행된 이 테스트는 작은 양자화된 모델이 에이전트 작업에서 효과적으로 작동하도록 하는 출력 제약의 중요성을 강조합니다.

media r/LocalLLaMA · 17시간 전

Lemonade SDK, 로컬 멀티미디어 역할극을 위한 RPG-HaloTales-V1 출시

Lemonade SDK는 사용자가 로컬에서 실행할 수 있는 멀티미디어 역할극 경험을 제공하도록 설계된 새로운 모델 RPG-HaloTales-V1을 출시했습니다.

media r/LocalLLaMA · 17시간 전

NPC 간 대화를 위한 오픈소스 로컬 LLM NPC 백엔드

저자는 클라우드 의존성 없이 NPC 간 직접 상호작용을 가능하게 하는 대규모 언어 모델(NLP) NPC를 위해 설계된 완전한 로컬 음성-음성 백엔드를 공개했습니다. 이 시스템은 음성-텍스트, 로컬 LLM, 텍스트-음성 구성 요소를 통합하여 NPC가 서로 대화하고, 문맥을 유지하며, 미래의 플레이어 상호작용에 영향을 줄 수 있도록 합니다.

media r/LocalLLaMA · 18시간 전

3x Spark 설정에 가장 적합한 코딩 모델은?

한 사용자가 3대의 Asus Ascent GX10 (GB10) 유닛으로 구성된 전용 하드웨어 세트업에서 실행할 최적의 코딩 모델에 대한 추천을 구하고 있습니다. 동시 사용자 수는 5-10명으로 예상됩니다.

media r/LocalLLaMA · 18시간 전

Hugging Face의 Andi가 Gemma 4 31B를 사용한 완전 오픈소스 음성 파이프라인을 시연

Hugging Face의 Andi는 음성 상호작용 파이프라인을 생성하는 완전한 오픈소스이고 무료인 데모를 출시했습니다. 이 시스템은 Nvidia의 parakeet, Cerebras가 서빙하는 Gemma 4 31B 모델, 그리고 Qwen3TTS에 대한 커스텀 추론을 통합합니다.

media r/LocalLLaMA · 18시간 전

Z.ai, Cursor, Claude Code, GitHub Copilot에 도전하는 ZCode 출시

Z.ai는 Cursor, Claude Code, GitHub Copilot와 같은 확립된 플랫폼과 경쟁하도록 설계된 새로운 AI 코딩 도구인 ZCode를 도입했습니다.

media r/LocalLLaMA · 18시간 전

Windows XP용 에이전트 AI를 위한 SimpleLLMChat 1.2.5 업데이트

개발자는 Windows XP와 .NET 4.0을 사용하여 레거시 머신에서 실행하도록 설계된 에이전트 AI 하네스인 SimpleLLMChat의 버전 1.2.5를 출시했습니다.