Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 10

OpenAI memamerkan model GPT-5.6 Sol, Terra, dan Luna

OpenAI telah memulai pratinjau terbatas untuk seri GPT-5.6, memperkenalkan tiga model baru: Sol sebagai unggulan utama, Terra untuk pekerjaan sehari-hari yang seimbang, dan Luna untuk tugas cepat dan terjangkau. Perusahaan berencana membuat model-model ini tersedia secara umum dalam beberapa minggu mendatang setelah fase awal ini dengan mitra terpercaya.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9817: Pembaruan OpenVINO 2026.2.1 dan peningkatan operator

Rilis llama.cpp b9817 memperbarui backend OpenVINO ke versi 2026.2.1 dan membuat paket rilis menjadi mandiri (self-contained). Pembaruan ini mencakup beberapa peningkatan operator di dalam backend OpenVINO, seperti menghapus set compute_op_type yang dikodekan secara keras (hardcoded) serta mengaktifkan softmax dengan input sink.

github llama.cpp · 5 hari lalu

Rilis b9813 llama.cpp menambahkan dukungan Vulkan untuk Intel Xe-LPG Plus

Rilis b9813 llama.cpp memperkenalkan dukungan Vulkan untuk perangkat keras Intel Xe-LPG Plus dengan menambahkan enum arsitektur INTEL_XE1 dan mengaktifkan coopmat1. Pembaruan ini menangani komentar kode sebelumnya, mengubah nama pengidentifikasi arsitektur, dan menyertakan pemeriksaan driver Windows.

github llama.cpp · 5 hari lalu

Rilis b9814 llama.cpp dengan optimasi Vulkan untuk mi50

Proyek llama.cpp telah merilis versi b9814, yang mencakup optimasi untuk operasi `mul_mat_vecq` di Vulkan yang secara khusus menargetkan GPU AMD mi50. Pembaruan ini disertai dengan sekumpulan lengkap biner pra-dibangun di berbagai sistem operasi dan arsitektur perangkat keras.

github MCP (GitHub org) · 5 hari lalu

Catatan Rilis MCP Python SDK v2.0.0a3

SDK Python Model Context Protocol (MCP) telah merilis versi alpha ketiganya, v2.0.0a3, yang memperkenalkan perubahan signifikan pada protokol dan arsitektur sambil mempertahankan kompatibilitas mundur bagi pengguna stabil 1.x.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9811 dengan solusi workaround kompilator Vulkan

Proyek llama.cpp telah merilis versi b9811, yang mencakup perbaikan untuk bug kompilator yang memengaruhi jalur conv2d coopmat2 di Vulkan. Solusi workaround ini juga diterapkan pada implementasi CONV_3D berdasarkan saran dari insinyur NVIDIA Jeff Bolz.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9810 menambahkan pemetaan cublasSgemmBatched dan biner baru

Proyek llama.cpp telah merilis versi b9810, memperkenalkan pemetaan CUDA untuk `cublasSgemmBatched` dalam header vendor HIP/MUSA. Pembaruan ini disertai dengan seperuhan komprehensif biner pra-dibangun untuk platform macOS, Linux, Windows, Android, dan openEuler.

github MCP (GitHub org) · 5 hari lalu

Rilis SDK Python Model Context Protocol v1.28.1

SDK Python Model Context Protocol telah merilis versi 1.28.1, memperkenalkan pembaruan pada penanganan aliran dan keamanan transportasi.

github llama.cpp · 6 hari lalu

Rilis llama.cpp b9804: Perbaikan Mamba2 dan biner baru

Rilis llama.cpp b9804 memperkenalkan perbaikan untuk arsitektur Mamba2 dengan menghapus faktor ekspansi 2x yang di-hardcode dan pemeriksaan parameter yang tidak valid, sehingga mendukung nilai expand apa pun. Perubahan ini memperbarui skrip `convert_hf_to_gguf.py` agar parameter expand bersifat opsional dengan nilai default 2.

github llama.cpp · 6 hari lalu

Rilis llama.cpp b9803 dengan perbaikan profil OpenCL

Proyek llama.cpp telah merilis versi b9803, yang mencakup perbaikan untuk OpenCL guna flushing batch profil saat shutdown untuk batch yang tidak lengkap. Pembaruan ini menyediakan biner untuk macOS, Linux, Windows, Android, dan openEuler di berbagai backend perangkat keras.

github llama.cpp · 6 hari lalu

Rilis b9802 llama.cpp menyediakan biner untuk macOS, Linux, Windows, dan Android

Proyek llama.cpp telah menerbitkan rilis b9802, menawarkan biner yang sudah dibangun di berbagai sistem operasi dan arsitektur perangkat keras. Pembaruan ini mencakup dukungan untuk CPU, GPU, dan akselerator AI khusus pada platform seperti macOS, Linux, Windows, Android, dan openEuler.

github SGLang · 6 hari lalu

v0.5.14

Artikel ini mengumumkan rilis versi 0.5.14.

lab Claude Code Releases · 6 hari lalu

Catatan Rilis Claude Code v2.1.193

Claude Code versi 2.1.193 memperkenalkan beberapa peningkatan pada klasifikasi mode otomatis, pencatatan telemetri, dan manajemen agen latar belakang. Pembaruan ini juga mencakup perbaikan untuk masalah status UI, penanganan autentikasi di server MCP, serta berbagai bug latar belakang.

lab Cohere Blog · 6 hari lalu

Mengotomatisasi pemeliharaan fork dengan agen AI

Artikel ini menggambarkan metode untuk mengotomatisasi pemeliharaan fork perangkat lunak menggunakan agen kode AI, menerapkannya pada fork Cohere dari vLLM. Pendekatan ini memangkas waktu yang dibutuhkan untuk menyerap rilis upstream dari minggu menjadi hari dengan mengganti intervensi manual dengan loop umpan balik otomatis.

lab Microsoft Research Blog · 6 hari lalu

Memahami otak dengan penjelasan dan eksperimen berbasis AI

Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.

lab Google — The Keyword (AI) · 6 hari lalu

Google Finance keluar dari fase beta dengan aplikasi Android baru

Google Finance secara resmi meninggalkan fase betanya dan meluncurkan aplikasi khusus untuk perangkat Android.

github vLLM · 6 hari lalu

v0.24.0rc2: Perbaiki P/D dengan Supervisor DP (#46628)

Rilis kandidat ini memperbaiki fungsionalitas Prefill/Decode (P/D) yang bekerja bersama Supervisor Data Parallelism (DP) dalam proyek vLLM.

lab Cohere Blog · 6 hari lalu

Cohere Otomatisasi Tanggap Insiden dengan North dan Wiz melalui Server MCP Kustom

Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.

github llama.cpp · 7 hari lalu

llama.cpp b9788 menambahkan paralelisme tensor SYCL untuk konfigurasi dual-GPU

Rilis llama.cpp b9788 memperkenalkan dukungan untuk paralelisme tensor melalui flag --split-mode tensor di backend SYCL. Implementasi ini memungkinkan komunikasi dual-GPU dengan menambahkan fungsi comm_init, comm_free, dan comm_allreduce_tensor ke meta-backend. Untuk dua perangkat, ia menggunakan strategi ring all-reduce yang beralih antara memcpy langsung FP32 untuk tensor kecil dan kompresi BF16 untuk yang lebih besar. Kode menghindari OneCCL karena keterbatasannya pada satu perangkat per proses, alih-alih menggunakan buffer persisten untuk mempertahankan invarian pool SYCL. Pengujian kinerja pada dual Intel Arc Pro B70 GPUs menunjukkan percepatan signifikan dibandingkan mode layer untuk model Llama-3.3-70B dan Qwen3-Coder-Next-80B-A3B. Pembaruan ini mencakup biner baru untuk macOS, Linux, Windows, Android, dan openEuler di berbagai target CPU, CUDA, ROCm, Vulkan, dan SYCL.

github llama.cpp · 7 hari lalu

Rilis b9789 llama.cpp Memperbaiki Kuantisasi MoE dan Menyediakan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9789, yang mencakup perbaikan kritis untuk mengkuantisasi model Mixture of Experts (MoE) dengan prediksi multi-token. Pembaruan ini mengatasi masalah yang diidentifikasi dalam pull request #24986 untuk memastikan penanganan yang tepat dari arsitektur model spesifik tersebut. Rilis ini menyediakan binari pra-dibangun untuk macOS Apple Silicon dan Intel, serta iOS XCFramework. Pengguna Linux dapat mengunduh build untuk Ubuntu di berbagai backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL. Dukungan Windows mencakup varian CPU, CUDA 12.4 dan 13.3, Vulkan, OpenVINO, SYCL, dan HIP. Platform tambahan seperti Android arm64 dan openEuler juga didukung dengan konfigurasi perangkat keras tertentu.