전체 기사 — korshunov.ai

전체 기사 페이지 1 / 22

DGX Spark와 Strix Halo를 사용한 분리형 프롬프트 처리

한 사용자가 DGX Spark를 사전 채우기(prefilling)에, Strix Halo 장치를 토큰 생성에 사용하여 분리형 추론 파이프라인을 구현했으며, 긴 컨텍스트 워크로드에서 상당한 속도 향상을 달성했습니다. 계산 집약적인 프롬프트 처리를 DGX로 오프로드하고 Strix의 메모리 대역폭을 디코딩에 활용함으로써, Strix 단독 실행 시 발생하는 성능 저하를 극복했습니다.

arxiv arXiv cs.CL · 5시간 전

LLM 비학습의 국소화 정밀도를 평가하기 위한 테스트베드 LACUNA

연구자들은 모델 파라미터에서 지식이 실제로 삭제되었는지 평가하는 간극을 해결하기 위해 지표 수준의 파라미터 국소화를 특징으로 하는 최초의 비학습 테스트베드인 LACUNA를 소개했습니다. 이 테스트베드는 마스킹된 지속적 사전 학습을 통해 1B 및 7B OLMo 기반 모델의 미리 정의된 파라미터에 합성 개인의 PII를 주입합니다.

blog Simon Willison · 6시간 전

참여하기 위해 이해하다

Geoffrey Litt는 개발자들이 인지적 부채를 피하고 창의적 과정에 적극적으로 참여할 수 있도록 코딩 에이전트가 생성한 코드를 깊이 이해해야 한다고 주장합니다.

media r/LocalLLaMA · 6시간 전

OpenLumara가 OpenAI 엔드포인트를 통해 모든 UI와 로컬 모델을 연결

오픈 소스 프레임워크인 OpenLumara는 이제 KoboldLite 및 OpenWebUI와 같이 OpenAI 엔드포인트와 통신할 수 있는 모든 사용자 인터페이스와의 연결을 지원합니다. 이 업데이트를 통해 사용자는 선호하는 프론트엔드를 변경하지 않고 토큰 효율적인 하네스를 기존 워크플로우에 통합할 수 있습니다.

media r/LocalLLaMA · 6시간 전

QGIS 같은 소프트웨어에서 대규모 공간 또는 도시 레이아웃 생성에 로컬 LLM을 사용하고 계신가요?

한 사용자가 전체 도시 레이아웃, 도로 네트워크, 복잡한 그리드 시스템과 같은 대규모 구조적 데이터를 생성할 수 있는 로컬 언어 모델에 대한 추천을 구하고 있습니다.

blog Simon Willison · 6시간 전

llm-coding-agent 0.1a0

Simon Willison은 LLM 라이브러리를 에이전트 프레임워크로 사용하여 간단한 코딩 에이전트를 구축하는 초기 실험인 llm-coding-agent 0.1a0을 출시했습니다. 이 프로젝트는 Claude Code에 명세를 작성하고 레드/그린 TDD를 사용하여 도구를 구현하도록 프롬프트하여 생성되었습니다.

media r/LocalLLaMA · 7시간 전

팁: llama.cpp PR를 사용하여 Intel ARC에서 PP 개선하기

llama.cpp에 대한 커뮤니티 풀 리퀘스트는 특히 B580과 같은 하드웨어에 유리한 Intel ARC 사용자의 프롬프트 처리 속도를 크게 향상시킵니다. 기여자는 Claude의 도움으로 코드를 최적화하여 컨텍스트 처리를 가속화했습니다.

media r/LocalLLaMA · 7시간 전

연구자들이 로컬 오픈 가중치 모델만으로 작동하는 자기 복제 AI 웜을 구축

새로운 Arxiv 논문은 로컬 오픈 가중치 모델만을 사용하여 기능하는 자기 복제 AI 웜의 생성을 상세히 설명합니다. 이 발전은 자율적 AI 에이전트가 외부 의존성 없이 작동할 잠재력을 보여줍니다.

media r/LocalLLaMA · 7시간 전

AMD GPU를 위한 HIP 커널 생성 개선: 합성 데이터, 다중 에이전트 탐색 및 강화 학습

스탠포드의 Scaling Intelligence 블로그의 이 기사는 합성 데이터, 다중 에이전트 탐색 및 강화 학습을 사용하여 AMD GPU용 HIP 커널 생성을 개선하는 방법에 대해 논의합니다.

lab ByteDance Seed (HF) · 7시간 전

ByteDance-Seed/PAR: 단백질 자기회귀 모델 체크포인트

이 저장소는 다중 스케일 구조 생성을 통한 단백질 자기회귀 모델을 위한 모델 체크포인트를 제공합니다. 이는 ICML 2026에서 구두 발표로 채택되었습니다.

lab Claude Code Releases · 7시간 전

Claude Code v2.1.199 릴리스 노트

Claude Code v2.1.199 업데이트는 SSL 인증서 오류, 스트리밍 응답 처리 및 백그라운드 에이전트 관리를 포함하여 수많은 안정성 및 사용성 문제를 해결합니다.

lab Anthropic News · 8시간 전

Anthropic, Fable 5 사이버 보안 조치 및 제일브레이크 프레임워크 상세 설명

Anthropic은 Claude Fable 5를 전 세계적으로 재배치하고 사이버 보안 안전 분류기 및 제안된 AI 제일브레이크 중증도 프레임워크에 대한 상세 정보를 공개했습니다. 동사는 정부와 제일브레이크 위험을 논의하기 위한 일관된 용어 체계를 확립하는 것을 목표로 하며, 더 넓은 커뮤니티로부터 피드백을 받고 있습니다.

media r/LocalLLaMA · 8시간 전

듀얼 R9700: Qwen3.6 27B에 최적의 공식은?

한 사용자가 llama.cpp를 사용하여 듀얼 AMD Radeon R9700 환경에서 Qwen3.6-27B 모델을 최적화하고 Vulkan과 ROCm 백엔드 간 성능을 비교합니다.

media r/LocalLLaMA · 8시간 전

Gemma 4 WebGPU 커널이 255 tok/s 달성

Xenova는 Gemma 4용 WebGPU 커널을 출시하여 초당 255개의 토큰 성능을 달성했습니다. 이 최적화를 통해 밀집 모델이 웹 브라우저에서 초당 100 T 이상의 속도로 실행될 수 있습니다.

blog Simon Willison · 8시간 전

DSPy를 사용하여 Datasette Agent의 SQL 시스템 프롬프트 평가 및 개선

Simon Willison은 Claude Code와 Fable 5 모델을 사용하여 Datasette Agent의 시스템 프롬프트 평가 및 최적화를 자동화했습니다. 이는 특히 읽기 전용 SQL 쿼리 실행 기능에 초점을 맞추고 있습니다. 이 과정에는 최신 Datasette alpha 버전과 DSPy 설치가 포함되었으며, 에이전트가 스키마 정보를 처리하는 방식의 약점을 파악하는 것을 목표로 합니다.

media r/LocalLLaMA · 8시간 전

Nvidia AI 개척자 AGI 거부, OpenAI와 Anthropic을 AOL에 비유

Nvidia의 저명한 인사는 인공지능 일반(AGI)을 믿지 않으며, 산업의 초점이 기업들을 위한 맞춤형 오픈소스 모델로 전환되어야 한다고 주장했습니다.

media r/LocalLLaMA · 9시간 전

RTX 3090 기반 로컬 벤치마크 - Qwen3.6 27b vs Ornith

한 사용자가 inspect-ai 프레임워크를 사용하여 RTX 3090에서 Qwen3.6 27b, Gemma4 26B A4B QAT, 그리고 Ornith1.0 35B MoE를 비교함으로써 로컬 모델 성능을 평가했습니다. 테스트 결과는 일반 지식, grounding(접근성), 코딩 벤치마크 전반에 걸쳐 혼합된 결과를 보였으며, Qwen3.6은 일반적으로 점수에서 우위를 차지한 반면 Ornith는 DROP과 같은 특정 영역에서 강점을 보였습니다.

media r/LocalLLaMA · 9시간 전

사용자가 Gemma 4 31B를 88층의 44B 모델로 확장

레딧 사용자는 60개의 레이어를 가진 Google Gemma 4 31B 모델을 88개의 레이어를 포함하는 더 큰 44B 파라미터 버전으로 확장했습니다. 이 수정은 Google이 Lyzr Architect에서 사용할 수 있는 더 큰 밀집(dense) 모델 버전을 출시하지 않았기 때문에 수행되었습니다.

media Hugging Face Forums · 10시간 전

증거 포화 k*: 검색 깊이는 추측이 아닌 교정되어야 함

LLM 호출에 대한 증거 깊이의 파일럿 벤치마크는 교정이 사실적 정확성뿐만 아니라 인식론적 오염과 프레임 리크를 포함해야 한다고 주장한다. 이 연구는 신뢰성이 최대화되는 증거 포화 지점을 'k*'로 정의하며, 표준 검색기 top-k 또는 상태 밀도 지표와 구분한다.

media Hugging Face Forums · 10시간 전

Epistemic Stress Test — Claude Sonnet 5가 MarCognity-AI에 의해 검증됨

이 기사는 Claude Sonnet 5의 검증을 다루며, MarCognity-AI의 Skeptical Agent를 사용하여 텍스트적 확신과 실제 검증 가능성 사이의 격차인 "Epistemic Fracture"를 드러냈습니다.