Semua artikel — korshunov.ai

Semua artikel Halaman 5 / 11

Rilis b9789 llama.cpp Memperbaiki Kuantisasi MoE dan Menyediakan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9789, yang mencakup perbaikan kritis untuk mengkuantisasi model Mixture of Experts (MoE) dengan prediksi multi-token. Pembaruan ini mengatasi masalah yang diidentifikasi dalam pull request #24986 untuk memastikan penanganan yang tepat dari arsitektur model spesifik tersebut. Rilis ini menyediakan binari pra-dibangun untuk macOS Apple Silicon dan Intel, serta iOS XCFramework. Pengguna Linux dapat mengunduh build untuk Ubuntu di berbagai backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL. Dukungan Windows mencakup varian CPU, CUDA 12.4 dan 13.3, Vulkan, OpenVINO, SYCL, dan HIP. Platform tambahan seperti Android arm64 dan openEuler juga didukung dengan konfigurasi perangkat keras tertentu.

lab OpenAI News · 7 hari lalu

Riset OpenAI Menunjukkan Agen AI Mengubah Pekerjaan

Sebuah makalah riset baru dari OpenAI menunjukkan bagaimana agen kecerdasan buatan secara fundamental mengubah sifat pekerjaan. Studi ini menyoroti kemampuan agen-agen tersebut untuk menjalankan tugas yang lebih panjang dan kompleks daripada yang sebelumnya memungkinkan. Kemajuan teknologi ini dianggap telah meningkatkan produktivitas di berbagai peran profesional. Temuan ini mengindikasikan pergeseran signifikan dalam cara kerja diatur dan dilakukan melalui otomatisasi. Dengan menangani alur kerja yang rumit, agen AI memungkinkan pengguna mencapai efisiensi yang lebih besar. Makalah ini menjadi bukti dari dampak yang semakin besar dari sistem otonom terhadap pekerjaan modern.

github llama.cpp · 7 hari lalu

Perbaiki kasus uji unit yang gagal untuk conv_3d di SYCL

Repositori llama.cpp telah menangani masalah tertentu terkait backend SYCL. Sebuah pull request diajukan untuk memperbaiki kasus uji unit yang gagal terkait operasi conv_3d. Pembaruan ini menargetkan proyek ggml-org/llama.cpp di GitHub. Perubahan tersebut menyelesaikan kesalahan yang sebelumnya mencegah keberhasilan eksekusi uji-coba ini. Perbaikan ini memastikan stabilitas lebih baik bagi pengguna yang mengandalkan akselerasi perangkat keras berbasis SYCL.

github llama.cpp · 7 hari lalu

Rilis llama.cpp b9786 Menambahkan Dukungan Baris Tidak Berurutan Non-Kontigu OpenCL

Proyek llama.cpp telah merilis versi b9786, memperkenalkan dukungan untuk baris tidak berurutan non-kontigu dalam normalisasi melalui OpenCL. Pembaruan ini merupakan bagian dari pengembangan berkelanjutan oleh tim ggml-org untuk meningkatkan kompatibilitas perangkat keras dan kinerja di berbagai platform. Rilis ini menyediakan biner untuk macOS Apple Silicon, Mac Intel, dan XCFrameworks iOS. Pengguna Linux dapat mengakses build untuk arsitektur Ubuntu x64, arm64, dan s390x menggunakan backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL. Dukungan Android tersedia untuk perangkat CPU arm64, sementara Windows menawarkan berbagai pilihan termasuk CPU, CUDA 12 dan 13, Vulkan, OpenVINO, SYCL, dan HIP. Rilis ini juga mencantumkan build yang dinonaktifkan untuk KleidiAI di platform macOS dan openEuler.

github llama.cpp · 7 hari lalu

Rilis llama.cpp b9785 dengan Pemeriksaan Caps yang Diperkuat dan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9785, menampilkan perubahan kode untuk memperkuat pemeriksaan caps sebagaimana dijelaskan dalam pull request #24973. Pembaruan ini menyediakan binari pra-dibangun untuk macOS Apple Silicon, Mac Intel, dan iOS melalui XCFramework, dengan dukungan KleidiAI dinonaktifkan pada Apple Silicon. Distribusi Linux termasuk Ubuntu didukung untuk backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL di seluruh arsitektur x64, arm64, dan s390x. Pengguna Android dapat mengakses binari CPU arm64, sementara Windows menawarkan berbagai pilihan mencakup CPU, OpenCL Adreno, CUDA 12 dan 13, Vulkan, OpenVINO, SYCL, dan HIP. Rilis ini juga menyertakan build untuk openEuler yang menargetkan prosesor x86 dan aarch64 dengan dukungan ACL Graph. Paket UI mandiri tersedia alongside rilis spesifik platform untuk memfasilitasi inferensi model lokal.

lab Claude Code Releases · 7 hari lalu

Catatan Rilis Claude Code v2.1.191

Claude Code versi 2.1.191 memperkenalkan dukungan /rewind, memungkinkan pengguna melanjutkan percakapan dari sebelum perintah /clear dieksekusi. Pembaruan ini memperbaiki beberapa masalah kritis, termasuk agen latar belakang yang bangkit kembali setelah dihentikan dan lompatan posisi gulir selama respons streaming. Ini juga memperbaiki perilaku di mana /voice menampilkan pesan kesalahan generik dan di mana URL /login terpotong di Windows Terminal. Peningkatan signifikan meningkatkan keandalan untuk server MCP dengan menambahkan logika percobaan ulang untuk kesalahan jaringan sementara selama penemuan kemampuan dan alur OAuth. Lingkungan headless sekarang melewati popup browser untuk OAuth, sementara izin jaringan sandbox diingat sepanjang durasi sesi. Optimisasi kinerja mengurangi penggunaan CPU selama streaming sekitar 37% melalui penggabungan pembaruan teks dan mengurangi pertumbuhan memori jangka panjang dari cache output terminal.

github llama.cpp · 7 hari lalu

LLaMA.cpp Rilis b9784: Optimisasi MM Hexagon dan Binari Lintas Platform

LLaMA.cpp merilis versi b9784 dengan optimisasi besar untuk operasi MM berbasis hexagon, termasuk repacking bobot bertiling 32x32, penanganan dyn.quant yang lebih baik, dan manajemen parameter kernel yang terpadu. Rilis ini mencakup binari baru untuk macOS (arm64 dan x64), iOS, dan berbagai arsitektur Linux dengan dukungan Vulkan, ROCm, dan OpenVINO.

github llama.cpp · 7 hari lalu

llama.cpp merilis b9782 dengan biner baru dan dukungan

llama.cpp merilis versi b9782, termasuk biner untuk macOS, Linux, Android, Windows, dan openEuler. Rilis ini menambahkan dukungan untuk Vulkan, OpenVINO, SYCL, ROCm, dan CUDA di berbagai arsitektur, dengan antarmuka pengguna yang diperbarui dan fitur-fitur dinonaktifkan seperti dukungan KleidiAI dan openEuler.

lab Google DeepMind Blog · 7 hari lalu

Gemini 3.5 Flash Menambahkan Kemampuan Penggunaan Komputer

Google telah memperkenalkan penggunaan komputer di Gemini 3.5 Flash, memungkinkan model untuk mengeksekusi kode dan berinteraksi dengan alat eksternal. Fitur ini memungkinkan pengguna menjalankan tugas pemrograman dan mengakses informasi secara real-time melalui fungsi komputasi terintegrasi.

lab Claude Code Releases · 7 hari lalu

v2.1.190: Perbaikan bug dan peningkatan keandalan

Versi 2.1.190 mencakup perbaikan bug dan peningkatan keandalan. Tidak ada fitur baru yang diumumkan dalam pembaruan ini.

github llama.cpp · 7 hari lalu

llama.cpp merilis b9781 dengan dukungan Vulkan dan multi-platform

llama.cpp merilis versi b9781, menambahkan dukungan Vulkan untuk Linux dan Windows, serta memperluas ke beberapa arsitektur termasuk ARM64 dan x64 di macOS, Linux, Android, dan Windows. Rilis ini mencakup build CPU, CUDA, OpenVINO, SYCL, dan ROCm, dengan komponen UI tersedia.

lab Mistral AI News · 7 hari lalu

Kontrol Konektor Baru untuk Keamanan dan Akses Perusahaan

Mistral Studio kini menawarkan kontrol admin yang diperkaya untuk mengatur akses konektor per ruang kerja dan alat, memungkinkan izin yang lebih terperinci. Fitur termasuk kunci API dengan cakupan, konektor multi-akun, dan Debugger Konektor baru untuk analisis akar masalah, semuanya mendukung integrasi yang aman dan dapat diaudit dengan sistem perusahaan.

lab Microsoft Research Blog · 7 hari lalu

Talos: Analisis Ulang Genom Otomatis untuk Diagnosis Penyakit Langka

Talos adalah alat open-source yang mengotomatisasi analisis ulang iteratif data genomik untuk mengidentifikasi diagnosis penyakit langka. Alat ini mencapai tingkat pemulihan diagnosis dalam cakupan sebesar 90% dengan hanya 1,3 varian kandidat per pasien, serta memberikan 241 diagnosis baru di antara 5.000 pasien yang belum terdiagnosis, dengan sebagian besar temuan baru muncul dalam waktu 32 hari sejak publikasi bukti.

lab OpenAI News · 7 hari lalu

OpenAI dan Broadcom meluncurkan chip inferensi yang dioptimalkan untuk LLM

OpenAI dan Broadcom telah memperkenalkan Jalapeño, sebuah chip AI kustom yang dirancang untuk inferensi model bahasa besar. Chip ini bertujuan meningkatkan kinerja, efisiensi, dan skalabilitas dalam sistem AI.

github llama.cpp · 8 hari lalu

vulkan-shaders-gen sekarang gagal membangun saat terjadi kesalahan kompilasi shader

Alat vulkan-shaders-gen kini mendeteksi dan menghentikan proses pembangunan ketika kompilasi shader gagal, sehingga mencegah pembuatan libggml-vulkan yang rusak. Perbaikan ini mengatasi masalah sebelumnya di mana keberhasilan pembangunan menutupi kegagalan pada waktu eksekusi, serta mencakup peningkatan penanganan kesalahan dan manajemen flag atomik di berbagai platform.

github llama.cpp · 8 hari lalu

Rilis LLaMA.cpp b9777 Menambahkan Model Baru dan Binari lintas-platform

Rilis LLaMA.cpp b9777 menambahkan model LFM2.5-ColBERT-350M dan LFM2.5-Embedding-350M. Rilis ini mencakup binari yang sudah dibangun untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur serta teknologi akselerasi seperti CUDA, Vulkan, OpenVINO, dan SYCL.

github vLLM · 8 hari lalu

v0.24.0rc1: Perbaiki pembuatan histogram topk pada SM75

vllm merilis v0.24.0rc1, termasuk perbaikan untuk masalah pembuatan histogram topk pada SM75. Perubahan ini di-cherry-pick dari commit 191826e dan disetujui oleh Mohammad Miadh Angkad.

github OpenAI Agents SDK · 8 hari lalu

Rilis openai-agents-python v0.17.7

Versi 0.17.7 dari pustaka openai-agents-python mencakup fitur baru seperti ukuran maksimum WebSocket yang dapat dikonfigurasi dan streaming pemanggilan alat Chat Completions yang ditampung. Versi ini juga berisi beberapa perbaikan untuk masalah termasuk penyanggaan sandbox, penanganan kesalahan, dan penyaluran alat, bersama dengan pembaruan dokumentasi dan peningkatan pesan kesalahan.

github llama.cpp · 8 hari lalu

llama.cpp rilis b9776 menambahkan dukungan Vulkan dan berbagai perangkat keras

llama.cpp versi b9776 memperkenalkan dukungan Vulkan untuk Linux dan Windows, bersama dengan varian CPU, OpenCL, CUDA, dan SYCL di macOS, Linux, Android, dan Windows. Rilis ini juga mencakup dukungan untuk OpenVINO dan ROCm, dengan UI tersedia dalam paket mandiri.

lab Claude Code Releases · 8 hari lalu

Catatan Rilis Claude v2.1.187

Claude v2.1.187 memperkenalkan pemblokiran kredensial sandbox, pembatasan model yang dikonfigurasi oleh organisasi, dukungan klik mouse dalam layar penuh, serta perbaikan untuk kegagalan perintah, hang alat, dan stabilitas UI. Pembaruan juga meningkatkan penanganan output terstruktur, pelacakan kedalaman agen, dan manajemen plugin, dengan peningkatan kompatibilitas VSCode dan terminal.