전체 기사
lab Microsoft Research Blog · 7일 전

AI 기반 설명과 실험으로 뇌 이해하기

연구자들은 해석 불가능한 LLM 기반 뇌 예측 모델을 피질 기능에 대한 간결하고 검증 가능한 언어 가설로 변환하는 프레임워크인 생성 인과 테스트(GCT)를 개발했습니다. 이 방법은 특정 뇌 영역이 "음식 준비"와 같은 것에 반응한다는 것을 설명하는 짧은 구절로 모델 매개변수를 압축한 후, 표적 fMRI 실험을 통해 이러한 설명을 검증합니다.

lab Hugging Face Blog · 7일 전

하이브리드 언어 모델의 토큰 예측 정확도 분석

최근 연구는 표준 밀집 아키텍처와 비교하여 하이브리드 언어 모델이 어떤 특정 토큰을 더 정확하게 예측하는지 조사합니다. 이 연구는 희귀 단어 및 코드 스니펫과 같은 다양한 토큰 유형 전반에 걸친 예측 오류의 분포를 이해하는 데 중점을 둡니다. 손실 지형을 분석함으로써 저자들은 하이브리드 모델이 희소 데이터 영역에서 장기 의존성을 포착하는 데 뛰어나다는 것을 확인했습니다. 연구 결과는 전문가 혼합 메커니즘이 추론 동안 더 효율적인 매개변수 활용을 가능하게 한다는 것을 시사합니다. 이러한 개선된 정확도는 훈련 코퍼스에서 낮은 빈도를 가진 토큰에 대해 특히 두드러집니다. 논문은 다양한 벤치마크 데이터셋 전반에 걸친 성능 지표의 상세한 내역을 제공합니다. 이러한 결과는 하이브리드 아키텍처가 다양한 언어 구조를 효과적으로 처리할 잠재력을 강조합니다.

lab Cohere Blog · 7일 전

Cohere, 커스텀 MCP 서버를 통해 North와 Wiz로 인시던트 대응 자동화

Cohere는 엔터프라이즈 AI 플랫폼인 Cohere North를 사용하여 보안 에이전트를 개발했으며, 이는 커스텀 Model Context Protocol (MCP) 서버를 통해 클라우드 보안 플랫폼 Wiz와 통합되었습니다. 이 아키텍처는 8개의 원자적 도구를 통해 North를 Wiz의 GraphQL API에 연결하여 단일 프롬프트에서 인시던트 대응 워크플로우를 자동화합니다. 시스템은 약 20초 만에 공격 체인을 평가하고 인터넷 노출 및 권한 수준을 기반으로 위험도를 순위 매김하여 유해한 조합의 폭발 반경 분석을 수행합니다. 또한 이슈 세부 정보 검색, Linear 티켓 생성, Wiz 상태 업데이트, 구조화된 인시던트 대응 보고서 작성을 통해 종단 간 조사를 자동화합니다. 추가로 매주 월요일 아침 수동 개입 없이 보안 포지션 브리핑을 생성하는 예약된 주간 자동화가 제공됩니다. 이 통합은 각 발견 사항당 30분에서 2시간에 걸친 이전의 분류 루프를 제거하여 엔지니어가 원시 알림이 아닌 평가 검토에 집중할 수 있도록 합니다.

media Hugging Face Forums · 7일 전

2026년 비용 효율적인 소형 언어 모델 파인튜닝 논의

Hugging Face 포럼의 최근 논의는 특정 작업에 맞게 소형 AI 모델을 사용자 정의하는 가장 효율적인 방법을 탐구합니다. "2026년에 소형 언어 모델을 파인튜닝하는 가장 비용 효율적인 방법은 무엇인가요?"라는 제목의 스레드는 성능을 유지하면서 비용을 최소화하는 방법에 대한 조언을 구합니다. 이는 특수 애플리케이션을 위한 워크플로우를 최적화하려는 한 참가자에 의해 시작되었습니다. 이 질문은 계산 오버헤드를 줄이기 위해 소형 모델을 활용하는 데 대한 관심이 높아지고 있음을 강조합니다. 현재 환경에서 비용과 효율성의 균형을 맞추는 전략을 공유할 것을 참여자들에게 권장합니다. 이 주제는 모델 적응을 더 접근 가능하고 저렴하게 만들기 위한 지속적인 노력을 반영합니다.