전체 기사 — korshunov.ai

전체 기사 페이지 1 / 21

데이터셋 변경 사항 감지 및 가져오기를 위한 모범 사례

Hugging Face 포럼의 한 사용자는 새 데이터가 추가되거나 데이터셋이 업데이트될 때 감지하고 전체 데이터셋을 다시 처리하지 않고 파이프라인을 트리거하기 위한 효율적인 방법을 요청했습니다.

PrismML의 1비트 Bonsai-8B가 구문을 사용한 CPU 도구 호출에서 IBM Granite를 제압

PrismML의 1비트 Bonsai-8B 모델과 IBM의 Granite 및 기타 LLM을 비교한 벤치마크 결과, Bonsai-8B는 구문 제약 디코딩을 사용할 때 가장 높은 도구 호출 정확도를 달성했습니다. llama.cpp를 사용하여 CPU에서 수행된 이 테스트는 작은 양자화된 모델이 에이전트 작업에서 효과적으로 작동하도록 하는 출력 제약의 중요성을 강조합니다.

media r/LocalLLaMA · 13시간 전

Lemonade SDK, 로컬 멀티미디어 역할극을 위한 RPG-HaloTales-V1 출시

Lemonade SDK는 사용자가 로컬에서 실행할 수 있는 멀티미디어 역할극 경험을 제공하도록 설계된 새로운 모델 RPG-HaloTales-V1을 출시했습니다.

media r/LocalLLaMA · 13시간 전

NPC 간 대화를 위한 오픈소스 로컬 LLM NPC 백엔드

저자는 클라우드 의존성 없이 NPC 간 직접 상호작용을 가능하게 하는 대규모 언어 모델(NLP) NPC를 위해 설계된 완전한 로컬 음성-음성 백엔드를 공개했습니다. 이 시스템은 음성-텍스트, 로컬 LLM, 텍스트-음성 구성 요소를 통합하여 NPC가 서로 대화하고, 문맥을 유지하며, 미래의 플레이어 상호작용에 영향을 줄 수 있도록 합니다.

media r/LocalLLaMA · 15시간 전

3x Spark 설정에 가장 적합한 코딩 모델은?

한 사용자가 3대의 Asus Ascent GX10 (GB10) 유닛으로 구성된 전용 하드웨어 세트업에서 실행할 최적의 코딩 모델에 대한 추천을 구하고 있습니다. 동시 사용자 수는 5-10명으로 예상됩니다.

media r/LocalLLaMA · 15시간 전

Hugging Face의 Andi가 Gemma 4 31B를 사용한 완전 오픈소스 음성 파이프라인을 시연

Hugging Face의 Andi는 음성 상호작용 파이프라인을 생성하는 완전한 오픈소스이고 무료인 데모를 출시했습니다. 이 시스템은 Nvidia의 parakeet, Cerebras가 서빙하는 Gemma 4 31B 모델, 그리고 Qwen3TTS에 대한 커스텀 추론을 통합합니다.

media r/LocalLLaMA · 15시간 전

Z.ai, Cursor, Claude Code, GitHub Copilot에 도전하는 ZCode 출시

Z.ai는 Cursor, Claude Code, GitHub Copilot와 같은 확립된 플랫폼과 경쟁하도록 설계된 새로운 AI 코딩 도구인 ZCode를 도입했습니다.

media r/LocalLLaMA · 15시간 전

Windows XP용 에이전트 AI를 위한 SimpleLLMChat 1.2.5 업데이트

개발자는 Windows XP와 .NET 4.0을 사용하여 레거시 머신에서 실행하도록 설계된 에이전트 AI 하네스인 SimpleLLMChat의 버전 1.2.5를 출시했습니다.

media r/LocalLLaMA · 15시간 전

당신의 RAG에는 무엇이 들어있나요?

한 레딧 사용자는 코딩, 시스템 관리 작업, 소규모 코드베이스를 다루는 개인 프로젝트에서 검색 증강 생성(RAG)의 실용적인 유용성에 대해 의문을 제기했습니다. 작성자는 표준 산업 지식이 이미 모델에 의해 잘 커버되어 있다고 주장하며, 코드베이스나 API 참조와 같은 특정 데이터 소스는 인덱싱이 필요할 만큼 크지 않거나 효율적으로 관리하기에는 너무 크다고 설명합니다.

media r/LocalLLaMA · 15시간 전

팔란티어 CEO, 폐쇄형 모델에 대해 격분

팔란티어의 CEO 알렉스 카프는 앤트로픽과 오픈AI가 고객에게 과도한 요금을 부과하고 데이터를 오용했다고 공개적으로 비판했다. 이 입장은 팔란티어가 최근 엔터프라이즈 고객을 위해 로컬 모델을 실행하기 위해 엔비디아 칩을 구매하는 계약을 체결한 시점에 나왔다.

media r/LocalLLaMA · 15시간 전

구조화된 출력의 신뢰성을 높이는 저렴한 트릭: 재시도 시 검증 오류를 피드백하기

대규모 언어 모델에서 구조화된 출력을 생성할 때 신뢰성을 향상시키기 위해, 검증 오류와 모델의 이전 출력을 재시도 시 프롬프트에 피드백하는 방법이 제안되었습니다. 이 접근 방식은 무작위 응답을 다시 생성하는 과정을 이전 시도를 편집하여 특정 오류를 자체 수정하는 방식으로 전환합니다.

media Hugging Face Forums · 20시간 전

보고된 ZeroGPU 슬롯과 나열된 Spaces 간의 불일치

사용자는 zero-a10g 하드웨어를 요청하는 Spaces가 8개뿐임에도 불구하고 제한 10에 대해 17개의 ZeroGPU 슬롯이 사용 중이라고 하는 할당량 오류를 겪었습니다.

media Hugging Face Forums · 20시간 전

Azure에서 SAM3 배포 중 SecretsInjectionError 발생

한 사용자가 Hugging Face Foundry 예제를 사용하여 Microsoft Azure에서 Meta SAM3 모델을 배포하려고 시도하는 동안 SecretsInjectionError를 겪었다고 보고했습니다. 이 오류는 배포된 API를 호출할 때 설정 및 설치 단계에서 발생합니다.

media Hugging Face Forums · 20시간 전

NanoI2V: Image-to-Video 모델을 처음부터 구축하기

NanoI2V은 Image-to-Video 생성 모델을 처음부터 구현하는 오픈소스 프로젝트로, 최신 비디오 생성 기술에 대한 깔끔하고 교육적인 참조를 제공하는 것을 목표로 합니다. 이 저장소는 대부분의 최신(SOTA) 프로젝트에서 발견되는 복잡성보다 가독성과 재현성을 우선시합니다.

media Hugging Face Forums · 20시간 전

내 연구를 HuggingFace에 게시하는 방법은?

한 사용자가 Hugging Face 포럼에서 자신의 연구 프로젝트인 TIS(토큰 중요도 스코어링)와 관련 코드 및 문서를 적절히 게시하는 방법에 대한 지침을 구하고 있습니다.

github Goose (Block) · 20시간 전

Goose v1.40.0 릴리스 노트

Goose v1.40.0 업데이트는 데스크톱 애플리케이션에 광범위한 로컬라이제이션 지원을 도입하여 프랑스어, 독일어, 이탈리아어, 포르투갈어, 인도네시아어, 말레이어, 베트남어, 번체 중국어, 한국어, 일본어, 스페인어, 힌디어의 로케일을 추가합니다.

media Hugging Face Forums · 23시간 전

Context Gravity

Chris Diaz가 현재 GitHub에서 사용할 수 있는 Context Gravity라는 새로운 프로젝트를 공유했습니다. 작성자는 저장소에 대한 커뮤니티 피드백을 구하고 있습니다.

media Hugging Face Forums · 1일 전

Show HF: ServBay, 코딩 에이전트를 위한 로컬 퍼스트 런타임 및 AI 게이트웨이

ServBay는 AI 코딩 에이전트와 사용자의 호스트 머신 간의 격차를 해소하기 위해 설계된 로컬 퍼스트 런타임 및 인프라 솔루션으로 소개되었습니다. 이는 지능형 에이전트가 수동 개발자 개입 없이 데이터베이스, 도메인 또는 SSL 인증서를 구성할 수 있는 시스템 수준의 능력을 갖추지 못한 '마일스톤' 문제를 해결합니다.

media Hugging Face Forums · 1일 전

Prism Transformer: 계층적 어텐션 처리를 위한 점진적 헤드 스케줄

Prism Transformer는 레이어 간 어텐션 헤드 수를 가변적으로 조절하는 점진적 헤드 스케줄을 도입합니다. 이는 초기 레이어에서 적고 넓은 헤드로 시작하여 깊이에 따라 단조 증가시킵니다. 이 접근 방식은 아키텍처 오버헤드를 추가하지 않고 초기와 후기 레이어의 구조적 필요를 해결함으로써 표준 균일 할당에 도전합니다.

github CrewAI · 1일 전

LangChain v1.15.2a2 릴리스 노트

이번 릴리스는 Bedrock 통합, 흐름 에이전트 문서화, 스트리밍 탐색의 새로운 기능과 버그 수정 및 문서 개선을 포함합니다.