Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 6

Rilis llama.cpp b9828: peningkatan Flash Attention OpenCL dan biner baru

Rilis llama.cpp b9828 memperkenalkan peningkatan signifikan pada OpenCL, khususnya dengan menyusun ulang kernel Flash Attention untuk presisi f16 dan f32. Pembaruan ini mencakup kernel prefill prepass baru serta dukungan untuk format kuantisasi q4_0 dan q8_0.

github llama.cpp · 4 hari lalu

Rilis llama.cpp b9827 menambahkan optimasi salinan async 2D CUDA

Rilis llama.cpp b9827 memperkenalkan optimasi kinerja untuk CUDA dengan menambahkan jalur cepat cudaMemcpy2DAsync ke fungsi ggml_cuda_cpy. Perubahan ini mempercepat salinan strided tipe dan bentuk yang sama di mana tensor tidak sepenuhnya kontigu tetapi setiap barisnya kontigu, menggantikan kernel salinan skalar elemen-demi-elemen yang lebih lambat.

github llama.cpp · 4 hari lalu

Rilis llama.cpp b9825: Perbaikan Vulkan dan Biner lintas-platform

Proyek llama.cpp telah merilis versi b9825, yang mencakup perbaikan untuk operator langkah Vulkan saat menangani input nol. Pembaruan ini menyediakan biner pra-dibangun untuk macOS, Linux, Windows, Android, dan openEuler di berbagai backend perangkat keras.

github llama.cpp · 4 hari lalu

Rilis b9826 llama.cpp dengan perbaikan norm SYCL

Proyek llama.cpp telah menerbitkan rilis b9826, yang mencakup perbaikan untuk kasus uji unit yang gagal terkait fungsi norm pada SYCL. Pembaruan ini menyediakan biner dan kerangka kerja yang sudah dibangun sebelumnya di berbagai platform dan akselerator perangkat keras.

github llama.cpp · 4 hari lalu

Rilis b9822 llama.cpp dengan biner macOS, Linux, Windows

Proyek llama.cpp telah menerbitkan rilis b9822, menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, dan Windows. Pembaruan ini mencakup perbaikan untuk opsi --no-common pada test-chat-template dan mendistribusikan build di berbagai arsitektur perangkat keras dan akselerator.

github llama.cpp · 4 hari lalu

Rilis b9823 llama.cpp menambahkan OpenVINO Windows dan memperbarui biner

Proyek llama.cpp telah menerbitkan versi b9823, menyediakan biner pra-dibangun untuk platform macOS, iOS, Linux, Android, Windows, dan openEuler. Perubahan utama dalam rilis ini adalah penambahan build OpenVINO Windows ke pipeline check-release.

github llama.cpp · 4 hari lalu

Rilis llama.cpp b9824: penamaan ulang biner dan build baru

Proyek llama.cpp telah merilis versi b9824, yang mencakup peningkatan pada biner rpc-server dan export-graph-ops. Alat `export-graph-ops` dinamai ulang untuk mengikuti konvensi penamaan pengujian, sementara `rpc-server` dinamai ulang menjadi `ggml-rpc-server` untuk menghindari konflik di direktori sistem.

github vLLM · 5 hari lalu

v0.24.0

Rilis v0.24.0 mencakup pembaruan integrasi berkelanjutan untuk meningkatkan batas waktu awal GSM8K pada konfigurasi MoE Refactor Qwen3 NVFP4.

lab OpenAI News · 5 hari lalu

OpenAI memamerkan model GPT-5.6 Sol, Terra, dan Luna

OpenAI telah memulai pratinjau terbatas untuk seri GPT-5.6, memperkenalkan tiga model baru: Sol sebagai unggulan utama, Terra untuk pekerjaan sehari-hari yang seimbang, dan Luna untuk tugas cepat dan terjangkau. Perusahaan berencana membuat model-model ini tersedia secara umum dalam beberapa minggu mendatang setelah fase awal ini dengan mitra terpercaya.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9821: Bendera CLI dan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9821, yang memperkenalkan pembaruan antarmuka baris perintah yang memungkinkan pengguna memanggil bendera --version, --licenses, dan --help. Rilis ini menyediakan seperangkat lengkap binari pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai akselerator perangkat keras.

lab Claude Code Releases · 5 hari lalu

Catatan Rilis Claude Code v2.1.195

Claude Code versi 2.1.195 memperkenalkan beberapa perbaikan dan peningkatan, termasuk variabel lingkungan baru untuk kontrol mouse dalam mode layar penuh serta koreksi pada logika pencocok hook.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9820: sinkronisasi CUDA berkurang dan biner baru

Rilis llama.cpp b9820 memperkenalkan peningkatan kinerja dengan reintroduksi sinkronisasi yang lebih sedikit selama komputasi terbagi, khususnya menargetkan backend CUDA. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, Linux, Windows, Android, dan openEuler di seluruh CPU, GPU, dan akselerator perangkat keras khusus.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9816: Sinkronisasi dengan ggml dan Binari Baru

Proyek llama.cpp telah merilis versi b9816, yang mencakup sinkronisasi dengan pustaka ggml. Pembaruan ini menyediakan binari pra-dibangun untuk platform macOS, iOS, Linux, Windows, Android, dan openEuler.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9817: Pembaruan OpenVINO 2026.2.1 dan peningkatan operator

Rilis llama.cpp b9817 memperbarui backend OpenVINO ke versi 2026.2.1 dan membuat paket rilis menjadi mandiri (self-contained). Pembaruan ini mencakup beberapa peningkatan operator di dalam backend OpenVINO, seperti menghapus set compute_op_type yang dikodekan secara keras (hardcoded) serta mengaktifkan softmax dengan input sink.

github llama.cpp · 5 hari lalu

Rilis b9813 llama.cpp menambahkan dukungan Vulkan untuk Intel Xe-LPG Plus

Rilis b9813 llama.cpp memperkenalkan dukungan Vulkan untuk perangkat keras Intel Xe-LPG Plus dengan menambahkan enum arsitektur INTEL_XE1 dan mengaktifkan coopmat1. Pembaruan ini menangani komentar kode sebelumnya, mengubah nama pengidentifikasi arsitektur, dan menyertakan pemeriksaan driver Windows.

github llama.cpp · 5 hari lalu

Rilis b9814 llama.cpp dengan optimasi Vulkan untuk mi50

Proyek llama.cpp telah merilis versi b9814, yang mencakup optimasi untuk operasi `mul_mat_vecq` di Vulkan yang secara khusus menargetkan GPU AMD mi50. Pembaruan ini disertai dengan sekumpulan lengkap biner pra-dibangun di berbagai sistem operasi dan arsitektur perangkat keras.

github MCP (GitHub org) · 5 hari lalu

Catatan Rilis MCP Python SDK v2.0.0a3

SDK Python Model Context Protocol (MCP) telah merilis versi alpha ketiganya, v2.0.0a3, yang memperkenalkan perubahan signifikan pada protokol dan arsitektur sambil mempertahankan kompatibilitas mundur bagi pengguna stabil 1.x.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9811 dengan solusi workaround kompilator Vulkan

Proyek llama.cpp telah merilis versi b9811, yang mencakup perbaikan untuk bug kompilator yang memengaruhi jalur conv2d coopmat2 di Vulkan. Solusi workaround ini juga diterapkan pada implementasi CONV_3D berdasarkan saran dari insinyur NVIDIA Jeff Bolz.

github MCP (GitHub org) · 5 hari lalu

Rilis SDK Python Model Context Protocol v1.28.1

SDK Python Model Context Protocol telah merilis versi 1.28.1, memperkenalkan pembaruan pada penanganan aliran dan keamanan transportasi.

github llama.cpp · 5 hari lalu

Rilis llama.cpp b9804: Perbaikan Mamba2 dan biner baru

Rilis llama.cpp b9804 memperkenalkan perbaikan untuk arsitektur Mamba2 dengan menghapus faktor ekspansi 2x yang di-hardcode dan pemeriksaan parameter yang tidak valid, sehingga mendukung nilai expand apa pun. Perubahan ini memperbarui skrip `convert_hf_to_gguf.py` agar parameter expand bersifat opsional dengan nilai default 2.