우리는 모두 어딘가에서 시작합니다
웹 기술 분야에서 25년 이상의 경험을 가진 개발자가 도구를 사용하는 것을 넘어 그로 빌드하는 방법을 이해하기 위해 AI 엔지니어링으로 전환하고 있습니다.
웹 기술 분야에서 25년 이상의 경험을 가진 개발자가 도구를 사용하는 것을 넘어 그로 빌드하는 방법을 이해하기 위해 AI 엔지니어링으로 전환하고 있습니다.
한 사용자가 'Ark-kun/tangent'라는 특정 개인 Hugging Face Space가 갑자기 작동을 멈췄고 재시작할 수 없다고 보고했습니다. 재시작하거나 공장 초기화 재빌드를 시도하면 "503. 이 Space를 재시작하는 동안 오류가 발생했습니다"라는 오류로 실패합니다.
llama.cpp b9840 릴리스는 Pro 변형에 대한 특정 처리를 포함하여 DeepSeek V4 모델의 변환 지원을 도입합니다. 이 업데이트는 다양한 내부 최적화 및 버그 수정과 함께 새로운 아키텍처를 라이브러리에 통합합니다.
OpenAI Economic Research은 ESCO 분류 체계와 유로스타 데이터를 활용하여 EU로 AI 일자리 전환 프레임워크를 확장했으며, 이는 AI 역량이 회원국 전반의 노동 시장을 어떻게 재편할 수 있는지 분석하는 데 사용되었습니다.
llama.cpp 프로젝트는 무시된 작업 트리의 Tailwind 스캔을 복원하는 수정 사항을 포함하는 버전 b9839를 출시했습니다. 이 업데이트는 다양한 아키텍처와 하드웨어 가속 백엔드에 대해 macOS, Linux, Android, Windows 및 openEuler용 사전 빌드 바이너리를 제공합니다.
llama.cpp 프로젝트가 버전 b9838을 출시하여 광범위한 운영 체제 및 하드웨어 가속기를 위한 사전 빌드된 바이너리를 제공합니다. 이번 릴리스에는 macOS, Linux, Windows, Android, openEuler 전반에 걸친 CPU, GPU(CUDA, Vulkan, ROCm, OpenCL) 및 전용 AI 가속기에 대한 지원이 포함되어 있습니다.
세대 간 컨텍스트 아키텍처(GCA)는 멀티 에이전트 시스템에서 "컨텍스트 부패"와 주의력 희석을 해결하기 위해 LLM의 컨텍스트 창을 무한 저장소가 아닌 유한한 수명으로 취급할 것을 제안합니다. 인공적인 사망을 강제함으로써 성능이 저하되기 전에 에이전트를 종료하고, 평면 파일 Markdown vault를 통해 상태를 새 세대에 전달합니다.
독립 연구자는 GPT-2, OPT-125M 및 Llama-3.2-1B를 포함한 7개의 오픈 가중치 모델에서 추론 중 숨겨진 표현의 진화를 분석하여 표준 출력 벤치마크를 넘어선 내부 역학 체계를 식별했습니다.
이 독립 연구 프로젝트는 표준 출력 벤치마크에 의존하는 대신 추론 동안 숨겨진 표현이 어떻게 진화하는지를 분석하여 일곱 개의 소형 및 중형 언어 모델의 내부 역학을 특징짓습니다. 이 연구는 서로 다른 아키텍처 전반에서 재현 가능한 패턴을 식별하기 위해 동적 행동, 기능적 조직화 및 표현 기하학을 조사합니다.
개발자가 역사적 데이터를 사용하여 토너먼트 결과를 시뮬레이션하는 2026년 월드컵 예측 도구를 만들었습니다. 이 애플리케이션은 약 50,000개의 국제 경기에서 학습된 패턴을 기반으로 임의의 두 국가 대표팀에 대한 승률과 점수 예측을 제공합니다.
Carles Marin은 트랜스포머 아키텍처의 수학적 기초와 실제 구현을 연결하는 오픈소스 양국어(영어 및 스페인어) 가이드를 출시했습니다. 이 리소스는 저수준 메커니즘에 중점을 두고 복잡한 주제를 설명하기 위해 재현 가능한 코드와 상호작용 요소를 제공합니다.
Transformer의 내부 작동 방식을 상세히 설명하는 오픈소스 양국어(영어/스페인어) 가이드가 출판되었습니다. 이 자료는 어텐션 붕괴 및 KV-캐시 압축과 같은 개념 뒤의 정확한 수학 및 메커니즘을 다룹니다.
HP Inc.은 성공적인 파일럿을 거치며 OpenAI와의 전략적 파트너십을 확대하고, 고객 경험, 직원 생산성, 소프트웨어 개발 전반에 AI를 배포하고 있습니다. 이 회사는 실험적 사용 사례에서 기업 전체의 프로덕션으로 전환하는 과정에서 컨텍스트, 권한, 평가를 관리하기 위해 통합 운영 모델로서 OpenAI Frontier 플랫폼을 활용합니다.
llama.cpp 프로젝트는 추론 토큰을 유지하기 위해 Jinja 채팅 템플릿용 새로운 `--reasoning-preserve` 플래그를 도입한 버전 b9837을 출시했습니다. 이 업데이트에는 수정된 도움말 메시지가 포함되어 있으며, 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler 에 대한 사전 빌드된 바이너리를 제공합니다.
저자는 토크나이저나 학습된 입력 임베딩 없이 0-파라미터 HSL 바이트 기판을 사용하여 음성-텍스트(STT) 및 텍스트-음성(TTS) 모델을 구축하는 연구 프로젝트인 HoLo-ToLk를 소개합니다. 이 작업은 특정 아키텍처 수정과 결합할 때 원시 HSL 바이트가 오디오 처리에 실행 가능한 신호로 사용될 수 있음을 보여줍니다.
llama.cpp 프로젝트는 단일 모델 모드에서 정지 및 추론 건너뛰기 기능에 대한 수정을 포함하는 버전 b9835를 출시했습니다. 이 업데이트는 모델 추론 중 제어를 개선하기 위해 사용자 인터페이스 내의 특정 문제를 해결합니다.
포럼 사용자는 신경망이나 AI 시스템을 바이너리 코드를 이해하도록 훈련시키는 것이 특히 코딩 작업에서 전반적인 능력을 크게 향상시킬 수 있는지라는 추측성 질문을 제기했습니다.
한 사용자가 금전적 거래의 필요성을 제거하면서 개인이 AI 모델을 학습하기 위해 데이터를 서로 교환할 수 있는 웹사이트의 개념을 제안합니다. 이 시스템은 크레딧 기반 경제에서 작동하며, 사용자는 정해진 양의 크레딧으로 시작하여 특정 데이터 요구 사항에 대한 바운티를 게시합니다.
llama.cpp 프로젝트가 버전 b9833을 출시하여, 다양한 버그 수정 및 리팩토링과 함께 MiniCPM5 모델 전용 파서를 도입했습니다. 이 업데이트에는 도구 호출 파싱 지원, 구문 단순화, 그리고 Jinja2 표준과의 호환성을 보장하기 위해 수정된 Jinja API 동작이 포함됩니다.
llama.cpp 프로젝트가 버전 b9832를 출시했으며, 이는 Jinja 템플릿 엔진을 위한 새로운 `--dump-prog` 명령줄 옵션을 도입하여 디버깅을 지원합니다. 이 업데이트는 다양한 CPU 및 GPU 아키텍처에서 macOS, Linux, Android, Windows, openEuler용 사전 빌드된 바이너리도 포함합니다.