전체 기사 — korshunov.ai — ML 뉴스

전체 기사 페이지 1 / 19

media Hugging Face Forums · 10일 전

역량은 가중치에 없다: MLP 가중치 투영에 대한 경험적 부정 결과

경험적 연구는 한 트랜스포머 모델에서 다른 모델로 MLP 가중치를 투영하는 것이 의미적 역량을 이전하지 못한다는 것을 발견했습니다. 테스트된 모든 변형은 수정되지 않은 호스트 모델보다 더 나쁜 성능을 보였으며, 이는 가중치 투영에 구조적 제한이 있음을 나타냅니다. 이 결과는 벤치마크를 기반으로 한 모델 역량에 대한 공개적인 주장을 도전하며, 그러한 주장이 실제 내부 가중치 기하학을 반영하지 않음을 보여줍니다.

media Hugging Face Forums · 10일 전

The Clockwork Dark: 로컬 퍼스트 AI 내러티브 RPG 엔진

The Clockwork Dark은 로컬 퍼스트이며 AI 기반의 내러티브 RPG 엔진으로, 모든 게임 메커니즘을 결정론적 상태 머신으로 처리합니다. 이 엔진은 이야기를 서술하는 두 개의 자율 LLM을 특징으로 하며, 하나는 인내심 있는 세계의 목소리로, 다른 하나는 신뢰할 수 없는 신적인 조수 역할을 합니다. 플레이어는 침식하는 초자연적 부패와 싸우거나 빵집에서 평온한 삶을 사는 것 중 선택할 수 있으며, 두 경로 모두 유효한 엔딩으로 간주됩니다.

media Hugging Face Forums · 10일 전

Docker 컨테이너가 실행 중인데도 '시작 중'에 무한히 멈춤

사용자는 rocker/r2u에서 R/Shiny를 사용하는 Docker 컨테이너가 성공적으로 빌드되었고 로그에 'Listening on http://0.0.0.0:7860'이 표시되지만, 공간이 'starting' 상태로 남아 접근할 수 없다고 보고합니다. 코드 오류가 없음에도 문제가 지속되고 있으며, 사용자는 이것이 Hugging Face의 플랫폼 측 문제일 수 있다고 지적하며 더 많은 관심을 구하고 있습니다.

media Hugging Face Forums · 10일 전

NOVA-VAD, 노이즈 있는 오디오에서 93% 정확도로 Silero, Pyannote, WebRTC를 압도

경량이고 설명 가능한 음성 활동 감지기인 NOVA-VAD는 UrbanSound8K 데이터세트의 노이즈 있는 오디오에서 93%의 정확도를 달성하여 WebRTC(58%), Pyannote(62%), Silero(87%)를 능가합니다. scikit-learn만 사용하며 GPU가 필요 없고, 평이한 영어로 기능 중요도와 신뢰 점수를 제공합니다.

media Hugging Face Forums · 10일 전

OLMo-core와 Engraft graft의 소규모 디버그 비교

기본 OLMo3 600M 모델과 DeepSeek 스타일 Engraft graft가 적용된 버전 간 200단계 학습 비교에서 더 낮은 학습 및 평가 손실, 더 빠른 grad-norm 안정화, 개선된 초기 학습 동작이 나타났습니다. 레이어 1과 5에 주입된 Engraft graft는 학습 가능한 매개변수를 약 17억으로 증가시키지만 토큰당 활성 매개변수 증가는 40k로 유지되어 효율적인 메모리 사용을 시사합니다.

media Hugging Face Forums · 10일 전

인지적 가속기로서의 LLM: 위험은 환각만이 아니다

LLM은 단순히 환각을 일으키는 것이 아니라, 증거가 검증되기 전에 약한 가설을 일관되고 다듬어진 주장으로 변환함으로써 인간의 인지적 과신(amplify human epistemic overconfidence)을 증폭시킵니다. 이는 모델이 거짓말을 하기 때문이 아니라, 불확실성보다 우아한 설명을 선호하는 인간의 경향을 가속화하기 때문에 연구, 정책 및 기타 분야에서 조속한 확신의 위험을 초래합니다.

media Hugging Face Forums · 10일 전

Tenstorrent AI 가속기 카드 출시

Tenstorrent이 Wormhole 및 Blackhole AI 가속기 카드를 출시했습니다. 하드웨어 섹션에는 이러한 카드가 나열되어 있으며, 어떤 모델이 호환될 가능성이 있는지에 대한 논의가 있습니다.

media Hugging Face Forums · 10일 전

Space가 오래된 커밋에서 16시간 이상 '재시작 중'으로 멈춤

Hugging Face Space가 커밋 8240352에서 16시간 이상 '재시작 중'으로 표시되고 있지만, 여러 개의 최신 커밋은 성공적으로 빌드되었습니다. 로그에서는 컨테이너가 건강하게 시작하지만 트래픽이 새 버전으로 전환되지 않으며, 공장 재빌드 또는 재시작과 같은 복구 작업도 효과가 없습니다.

github llama.cpp · 10일 전

llama.cpp b9751 릴리스: 새로운 바이너리 및 수정 사항

llama.cpp가 macOS, Linux, Android, Windows, openEuler용 업데이트된 바이너리를 포함하는 버전 b9751을 출시했습니다. 이번 릴리스에는 메모리 사용량 관련 수정 사항이 포함되어 있으며, Vulkan, CUDA, OpenVINO, SYCL과 같은 여러 아키텍처 및 하드웨어 가속 옵션을 지원합니다.

github llama.cpp · 10일 전

llama.cpp b9752 릴리스: 서버 리팩토링 및 크로스 플랫폼 바이너리

llama.cpp가 버전 b9752를 출시했으며, 이는 배치 구성에 중점을 둔 서버 리팩토링을 포함하며, 배치 풀(full) 케이스 처리 개선 및 버그 수정이 이루어졌습니다. 이 릴리스에는 macOS, Linux, Android, Windows, openEuler용 사전 빌드된 바이너리가 포함되어 있으며, CUDA, Vulkan, OpenVINO, SYCL과 같은 다양한 아키텍처와 가속 프레임워크를 지원합니다.

github llama.cpp · 10일 전

llama.cpp b9753 릴리스: 새로운 바이너리 및 진행률 보고

llama.cpp 버전 b9753은 "stages" 목록을 포함하여 스펙 모델 로드에 대한 개선된 진행률 보고를 도입합니다. 이 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL과 같은 여러 아키텍처 및 하드웨어 가속 옵션에 대한 macOS, Linux, Android, Windows, openEuler용 바이너리가 포함되어 있습니다.

github llama.cpp · 10일 전

llama.cpp b9754 릴리스: 새로운 AC 파서 및 크로스 플랫폼 바이너리

llama.cpp 버전 b9754는 common/peg 모듈에서 더 엄격한 구문 생성을 위한 AC 파서를 도입합니다. 이번 릴리스에는 macOS, Linux, Android, Windows, openEuler를 위한 사전 컴파일된 바이너리가 포함되어 있으며, Vulkan, CUDA, OpenVINO, SYCL과 같은 다양한 아키텍처와 가속 기술을 지원합니다.

github llama.cpp · 10일 전

Android 빌드를 위해 libandroid-spawn 의존성 추가

Android 빌드 문서에 libandroid-spawn에 대한 의존성이 포함되도록 업데이트되었습니다. 이 추가는 지정된 환경 내에서 빌드 프로세스를 지원하기 위한 것입니다.

lab OpenAI News · 10일 전

삼성전자, 직원 대상 ChatGPT 및 Codex 도입

삼성전자가 전 세계 직원들을 대상으로 OpenAI의 ChatGPT Enterprise와 Codex를 출시했습니다. 이번 도입은 지금까지 OpenAI가 진행한 기업용 AI 프로젝트 중 최대 규모입니다.

github llama.cpp · 11일 전

llama.cpp b9750 릴리스: 새로운 call 구문 및 크로스 플랫폼 바이너리

llama.cpp 버전 b9750은 call 구문 구현을 도입하고 의도치 않은 변경 사항을 되돌립니다. 이번 릴리스에는 Vulkan, CUDA, OpenVINO, SYCL을 포함한 다양한 아키텍처와 하드웨어 가속화 옵션에 대한 macOS, Linux, Android, Windows, openEuler용 사전 컴파일된 바이너리가 포함되어 있습니다.

github llama.cpp · 11일 전

llama.cpp가 새로운 바이너리와 기능을 갖춘 버전 b9748 출시

llama.cpp는 버전 b9748을 출시하며 스키마에 "verbose" 필드를 추가하고 macOS, Linux, Android, Windows, openEuler용 바이너리를 제공합니다. 이번 릴리스에는 여러 아키텍처에서 CPU, Vulkan, OpenVINO, SYCL, ROCm 지원이 포함되며, iOS 및 Windows CUDA와 Vulkan 빌드도 제공됩니다.

media Hugging Face Forums · 11일 전

고착된 Hugging Face Space 강제 삭제 요청

사용자가 "Building" 상태에 고착된 Hugging Face Space "kayinda/rxsteward"의 강제 삭제를 요청합니다. 모든 삭제 시도는 403 오류 또는 400 유효하지 않은 입력 오류로 실패하여 이름 재사용이 불가능합니다.

lab Hugging Face Blog · 11일 전

파인튜닝에서 LoRA를 이길 수 있나요?

새로운 연구는 가장 인기 있는 파인튜닝 기법인 LoRA의 대안을 탐구하고 있으며, 다른 방법들이 더 적은 계산 비용으로 더 나은 성능을 달성할 수 있는지 평가합니다. 연구 결과, 일부 접근 방식은 유망함을 보이지만 다양한 작업과 데이터셋에서 LoRA를 일관되게 능가하는 방법은 없습니다.

lab Google DeepMind Blog · 11일 전

내부 시스템 보안을 위한 AI 통제 로드맵

기존의 안전 장치와 실시간 모니터링 기능을 통합하여 내부 시스템을 보호하기 위해 AI 통제 로드맵이 도입되었습니다.

lab OpenAI News · 11일 전

GPT-5.5 Instant이 ChatGPT의 건강 응답을 향상시킵니다

GPT-5.5 Instant은 더 강력한 추론, 개선된 컨텍스트 처리, 명확한 의사소통, 그리고 의사가 참여한 평가를 통해 ChatGPT의 건강 및 웰빙 응답을 개선합니다.