전체 기사 — korshunov.ai

전체 기사 페이지 1 / 16

MCP Python SDK v2.0.0a3 릴리스 노트

Model Context Protocol (MCP) Python SDK가 세 번째 알파 버전인 v2.0.0a3를 출시했으며, 이는 안정적인 1.x 사용자를 위한 하위 호환성을 유지하면서 상당한 프로토콜 및 아키텍처 변경 사항을 도입했습니다.

github llama.cpp · 6일 전

llama.cpp b9804 릴리스: Mamba2 수정 및 새로운 바이너리

llama.cpp b9804 릴리스는 고정된 2x 확장 계수와 유효하지 않은 매개변수 검사를 제거하여 Mamba2 아키텍처에 대한 수정을 도입하고, 모든 expand 값을 지원할 수 있도록 합니다. 이 변경은 expand 매개변수를 기본값 2로 선택적으로 만드는 `convert_hf_to_gguf.py` 스크립트를 업데이트합니다.

media Hugging Face Forums · 6일 전

JoeBro: 의존성 제로의 네이티브 macOS AI 워크스페이스

JoeBro는 pip나 Docker와 같은 외부 의존성을 필요로 하지 않는 AI 워크스페이스를 제공하도록 설계된 로컬 퍼스트 네이티브 macOS 애플리케이션입니다. 번들된 Python 백엔드와 SQLite 스토리지를 갖추고 있어 모든 데이터가 사용자 머신에 남아 있도록 하며, 텔레메트리와 계정 요구사항을 제거합니다.

media Hugging Face Forums · 6일 전

Hugging Face 데이터셋/데이터베이스에 누군가를 추가하려면 어떻게 해야 하나요?

제공된 소스 콘텐츠는 원래 게시물의 주제가 작성자에 의해 삭제되었음을 나타냅니다. 따라서 이 발췌문에는 Hugging Face 데이터셋 또는 데이터베이스에 사용자를 추가하는 과정과 관련된 구체적인 정보가 없습니다.

github CrewAI · 6일 전

crewAI 1.15.0 릴리스 노트

crewAI 1.15.0 릴리스는 Flow 정의에 상당한 개선을 도입했으며, 여기에는 통합 선언적 로드, 인라인 crew 지원 및 `each` 및 단일 에이전트 액션과 같은 새로운 복합 액션이 포함됩니다.

github llama.cpp · 6일 전

OpenCL 프로파일링 수정이 포함된 llama.cpp b9803 릴리스

llama.cpp 프로젝트가 버전 b9803을 출시했으며, 여기에는 불완전한 배치에 대해 종료 시 OpenCL의 프로파일링 배치를 플러시하는 수정 사항이 포함되어 있습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler용 바이너리를 제공합니다.

github AutoGPT · 6일 전

AutoGPT Platform Beta v0.6.65 릴리스 노트

AutoGPT 플랫폼이 버전 0.6.65을 출시하여 Copilot 시스템, 사용자 인터페이스 탐색 및 인프라 신뢰성에 상당한 업데이트를 도입했습니다.

github llama.cpp · 6일 전

llama.cpp b9802 릴리스는 macOS, Linux, Windows 및 Android용 바이너리를 제공합니다

llama.cpp 프로젝트가 여러 운영 체제와 하드웨어 아키텍처에서 사전 빌드된 바이너리를 제공하는 b9802 릴리스를 게시했습니다. 이 업데이트에는 macOS, Linux, Windows, Android, openEuler 플랫폼에서 CPU, GPU 및 특수 AI 가속기에 대한 지원이 포함됩니다.

github SGLang · 6일 전

v0.5.14

본 기사에서는 버전 0.5.14의 출시를 발표합니다.

lab Claude Code Releases · 7일 전

Claude Code v2.1.193 릴리스 노트

Claude Code 버전 2.1.193은 자동 모드 분류, 텔레메트리 로깅 및 백그라운드 에이전트 관리에 여러 개선을 도입합니다. 이 업데이트에는 UI 상태 문제, MCP 서버의 인증 처리, 다양한 백그라운딩 버그 수정도 포함됩니다.

lab Cohere Blog · 7일 전

AI 에이전트를 활용한 포크 유지보수 자동화

이 글은 AI 코딩 에이전트를 사용하여 소프트웨어 포크의 유지보수를 자동화하는 방법을 설명하며, Cohere의 vLLM 포크에 이를 적용합니다. 이 접근 방식은 수동 개입을 자동화된 피드백 루프로 대체함으로써 상위 저장소(upstream) 릴리스를 통합하는 데 걸리는 시간을 주에서 일로 단축합니다.

github Goose (Block) · 7일 전

v1.39.0

이 릴리스는 Flatpak 빌드를 수정하려고 시도합니다.

lab Microsoft Research Blog · 7일 전

AI 기반 설명과 실험으로 뇌 이해하기

연구자들은 해석 불가능한 LLM 기반 뇌 예측 모델을 피질 기능에 대한 간결하고 검증 가능한 언어 가설로 변환하는 프레임워크인 생성 인과 테스트(GCT)를 개발했습니다. 이 방법은 특정 뇌 영역이 "음식 준비"와 같은 것에 반응한다는 것을 설명하는 짧은 구절로 모델 매개변수를 압축한 후, 표적 fMRI 실험을 통해 이러한 설명을 검증합니다.

lab Google — The Keyword (AI) · 7일 전

구글 파이낸스, 새로운 안드로이드 앱과 함께 베타 종료

구글 파이낸스가 공식적으로 베타 단계를 벗어나 안드로이드 기기를 위한 전용 애플리케이션을 출시합니다.

lab Hugging Face Blog · 7일 전

한 번의 명령으로 HF Jobs에서 vLLM 서버 실행

Hugging Face는 단일 명령을 사용하여 Hugging Face Jobs 플랫폼을 통해 vLLM 서버를 직접 배포할 수 있는 새로운 기능을 도입했습니다.

github vLLM · 7일 전

v0.24.0rc2: DP Supervisor와 함께 P/D 수정 (#46628)

이 릴리스 후보는 vLLM 프로젝트 내에서 데이터 병렬화(DP) Supervisor와 함께 Prefill/Decode(P/D) 기능에 대한 수정을 다룹니다.

github CrewAI · 7일 전

crewAI 1.14.8a5 릴리스 노트

crewAI 버전 1.14.8a5 업데이트는 흐름 상태 관리, 문서 업데이트 및 리팩토링 작업에 대한 변경 사항을 도입합니다.

lab Hugging Face Blog · 7일 전

최근 연구는 표준 밀집 아키텍처와 비교하여 하이브리드 언어 모델이 어떤 특정 토큰을 더 정확하게 예측하는지 조사합니다. 이 연구는 희귀 단어 및 코드 스니펫과 같은 다양한 토큰 유형 전반에 걸친 예측 오류의 분포를 이해하는 데 중점을 둡니다. 손실 지형을 분석함으로써 저자들은 하이브리드 모델이 희소 데이터 영역에서 장기 의존성을 포착하는 데 뛰어나다는 것을 확인했습니다. 연구 결과는 전문가 혼합 메커니즘이 추론 동안 더 효율적인 매개변수 활용을 가능하게 한다는 것을 시사합니다. 이러한 개선된 정확도는 훈련 코퍼스에서 낮은 빈도를 가진 토큰에 대해 특히 두드러집니다. 논문은 다양한 벤치마크 데이터셋 전반에 걸친 성능 지표의 상세한 내역을 제공합니다. 이러한 결과는 하이브리드 아키텍처가 다양한 언어 구조를 효과적으로 처리할 잠재력을 강조합니다.

lab Cohere Blog · 7일 전

Cohere, 커스텀 MCP 서버를 통해 North와 Wiz로 인시던트 대응 자동화

Cohere는 엔터프라이즈 AI 플랫폼인 Cohere North를 사용하여 보안 에이전트를 개발했으며, 이는 커스텀 Model Context Protocol (MCP) 서버를 통해 클라우드 보안 플랫폼 Wiz와 통합되었습니다. 이 아키텍처는 8개의 원자적 도구를 통해 North를 Wiz의 GraphQL API에 연결하여 단일 프롬프트에서 인시던트 대응 워크플로우를 자동화합니다. 시스템은 약 20초 만에 공격 체인을 평가하고 인터넷 노출 및 권한 수준을 기반으로 위험도를 순위 매김하여 유해한 조합의 폭발 반경 분석을 수행합니다. 또한 이슈 세부 정보 검색, Linear 티켓 생성, Wiz 상태 업데이트, 구조화된 인시던트 대응 보고서 작성을 통해 종단 간 조사를 자동화합니다. 추가로 매주 월요일 아침 수동 개입 없이 보안 포지션 브리핑을 생성하는 예약된 주간 자동화가 제공됩니다. 이 통합은 각 발견 사항당 30분에서 2시간에 걸친 이전의 분류 루프를 제거하여 엔지니어가 원시 알림이 아닌 평가 검토에 집중할 수 있도록 합니다.

media Hugging Face Forums · 7일 전

2026년 비용 효율적인 소형 언어 모델 파인튜닝 논의

Hugging Face 포럼의 최근 논의는 특정 작업에 맞게 소형 AI 모델을 사용자 정의하는 가장 효율적인 방법을 탐구합니다. "2026년에 소형 언어 모델을 파인튜닝하는 가장 비용 효율적인 방법은 무엇인가요?"라는 제목의 스레드는 성능을 유지하면서 비용을 최소화하는 방법에 대한 조언을 구합니다. 이는 특수 애플리케이션을 위한 워크플로우를 최적화하려는 한 참가자에 의해 시작되었습니다. 이 질문은 계산 오버헤드를 줄이기 위해 소형 모델을 활용하는 데 대한 관심이 높아지고 있음을 강조합니다. 현재 환경에서 비용과 효율성의 균형을 맞추는 전략을 공유할 것을 참여자들에게 권장합니다. 이 주제는 모델 적응을 더 접근 가능하고 저렴하게 만들기 위한 지속적인 노력을 반영합니다.

MCP Python SDK v2.0.0a3 릴리스 노트

llama.cpp b9804 릴리스: Mamba2 수정 및 새로운 바이너리

JoeBro: 의존성 제로의 네이티브 macOS AI 워크스페이스

Hugging Face 데이터셋/데이터베이스에 누군가를 추가하려면 어떻게 해야 하나요?

crewAI 1.15.0 릴리스 노트

OpenCL 프로파일링 수정이 포함된 llama.cpp b9803 릴리스

AutoGPT Platform Beta v0.6.65 릴리스 노트

llama.cpp b9802 릴리스는 macOS, Linux, Windows 및 Android용 바이너리를 제공합니다

v0.5.14

Claude Code v2.1.193 릴리스 노트

AI 에이전트를 활용한 포크 유지보수 자동화

v1.39.0

AI 기반 설명과 실험으로 뇌 이해하기

구글 파이낸스, 새로운 안드로이드 앱과 함께 베타 종료

한 번의 명령으로 HF Jobs에서 vLLM 서버 실행

v0.24.0rc2: DP Supervisor와 함께 P/D 수정 (#46628)

crewAI 1.14.8a5 릴리스 노트

하이브리드 언어 모델의 토큰 예측 정확도 분석

Cohere, 커스텀 MCP 서버를 통해 North와 Wiz로 인시던트 대응 자동화

2026년 비용 효율적인 소형 언어 모델 파인튜닝 논의