Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 13

Catatan Rilis Beta Platforma AutoGPT v0.6.65

Platforma AutoGPT telah merilis versi 0.6.65, memperkenalkan pembaruan signifikan pada sistem Copilot, navigasi antarmuka pengguna, dan keandalan infrastruktur.

lab Microsoft Research Blog · 6 hari lalu

Memahami otak dengan penjelasan dan eksperimen berbasis AI

Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.

lab Google — The Keyword (AI) · 6 hari lalu

Google Finance keluar dari fase beta dengan aplikasi Android baru

Google Finance secara resmi meninggalkan fase betanya dan meluncurkan aplikasi khusus untuk perangkat Android.

lab Hugging Face Blog · 6 hari lalu

Jalankan Server vLLM di HF Jobs dengan Satu Perintah

Hugging Face telah memperkenalkan fitur baru yang memungkinkan pengguna untuk men-deploy server vLLM secara langsung melalui platform Hugging Face Jobs menggunakan satu perintah.

github vLLM · 6 hari lalu

v0.24.0rc2: Perbaiki P/D dengan Supervisor DP (#46628)

Rilis kandidat ini memperbaiki fungsionalitas Prefill/Decode (P/D) yang bekerja bersama Supervisor Data Parallelism (DP) dalam proyek vLLM.

github CrewAI · 6 hari lalu

Catatan Rilis crewAI 1.14.8a5

Pembaruan versi 1.14.8a5 dari crewAI memperkenalkan perubahan pada manajemen keadaan aliran, pembaruan dokumentasi, dan upaya refactoring.

lab Hugging Face Blog · 6 hari lalu

Analisis Akurasi Prediksi Token dalam Model Bahasa Hibrida

Sebuah studi terbaru menyelidiki token spesifik mana yang diprediksi lebih akurat oleh model bahasa hibrida dibandingkan dengan arsitektur padat standar. Penelitian ini berfokus pada pemahaman distribusi kesalahan prediksi di berbagai jenis token, seperti kata langka dan cuplikan kode. Dengan menganalisis lanskap kerugian, penulis mengidentifikasi bahwa model hibrida unggul dalam menangkap ketergantungan jarak jauh di wilayah data jarang. Temuan tersebut menunjukkan bahwa mekanisme campuran ahli memungkinkan pemanfaatan parameter yang lebih efisien selama inferensi. Akurasi yang meningkat ini sangat mencolok untuk token dengan frekuensi rendah dalam korpus pelatihan. Makalah ini memberikan rincian mendetail dari metrik kinerja di berbagai dataset benchmark. Hasil-hasil ini menyoroti potensi arsitektur hibrida untuk menangani struktur linguistik yang beragam secara efektif.

lab Cohere Blog · 6 hari lalu

Cohere Otomatisasi Tanggap Insiden dengan North dan Wiz melalui Server MCP Kustom

Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.

github llama.cpp · 7 hari lalu

llama.cpp b9788 menambahkan paralelisme tensor SYCL untuk konfigurasi dual-GPU

Rilis llama.cpp b9788 memperkenalkan dukungan untuk paralelisme tensor melalui flag --split-mode tensor di backend SYCL. Implementasi ini memungkinkan komunikasi dual-GPU dengan menambahkan fungsi comm_init, comm_free, dan comm_allreduce_tensor ke meta-backend. Untuk dua perangkat, ia menggunakan strategi ring all-reduce yang beralih antara memcpy langsung FP32 untuk tensor kecil dan kompresi BF16 untuk yang lebih besar. Kode menghindari OneCCL karena keterbatasannya pada satu perangkat per proses, alih-alih menggunakan buffer persisten untuk mempertahankan invarian pool SYCL. Pengujian kinerja pada dual Intel Arc Pro B70 GPUs menunjukkan percepatan signifikan dibandingkan mode layer untuk model Llama-3.3-70B dan Qwen3-Coder-Next-80B-A3B. Pembaruan ini mencakup biner baru untuk macOS, Linux, Windows, Android, dan openEuler di berbagai target CPU, CUDA, ROCm, Vulkan, dan SYCL.

github llama.cpp · 7 hari lalu

Rilis b9789 llama.cpp Memperbaiki Kuantisasi MoE dan Menyediakan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9789, yang mencakup perbaikan kritis untuk mengkuantisasi model Mixture of Experts (MoE) dengan prediksi multi-token. Pembaruan ini mengatasi masalah yang diidentifikasi dalam pull request #24986 untuk memastikan penanganan yang tepat dari arsitektur model spesifik tersebut. Rilis ini menyediakan binari pra-dibangun untuk macOS Apple Silicon dan Intel, serta iOS XCFramework. Pengguna Linux dapat mengunduh build untuk Ubuntu di berbagai backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL. Dukungan Windows mencakup varian CPU, CUDA 12.4 dan 13.3, Vulkan, OpenVINO, SYCL, dan HIP. Platform tambahan seperti Android arm64 dan openEuler juga didukung dengan konfigurasi perangkat keras tertentu.

lab OpenAI News · 7 hari lalu

Riset OpenAI Menunjukkan Agen AI Mengubah Pekerjaan

Sebuah makalah riset baru dari OpenAI menunjukkan bagaimana agen kecerdasan buatan secara fundamental mengubah sifat pekerjaan. Studi ini menyoroti kemampuan agen-agen tersebut untuk menjalankan tugas yang lebih panjang dan kompleks daripada yang sebelumnya memungkinkan. Kemajuan teknologi ini dianggap telah meningkatkan produktivitas di berbagai peran profesional. Temuan ini mengindikasikan pergeseran signifikan dalam cara kerja diatur dan dilakukan melalui otomatisasi. Dengan menangani alur kerja yang rumit, agen AI memungkinkan pengguna mencapai efisiensi yang lebih besar. Makalah ini menjadi bukti dari dampak yang semakin besar dari sistem otonom terhadap pekerjaan modern.

github llama.cpp · 7 hari lalu

Perbaiki kasus uji unit yang gagal untuk conv_3d di SYCL

Repositori llama.cpp telah menangani masalah tertentu terkait backend SYCL. Sebuah pull request diajukan untuk memperbaiki kasus uji unit yang gagal terkait operasi conv_3d. Pembaruan ini menargetkan proyek ggml-org/llama.cpp di GitHub. Perubahan tersebut menyelesaikan kesalahan yang sebelumnya mencegah keberhasilan eksekusi uji-coba ini. Perbaikan ini memastikan stabilitas lebih baik bagi pengguna yang mengandalkan akselerasi perangkat keras berbasis SYCL.

github llama.cpp · 7 hari lalu

Rilis llama.cpp b9786 Menambahkan Dukungan Baris Tidak Berurutan Non-Kontigu OpenCL

Proyek llama.cpp telah merilis versi b9786, memperkenalkan dukungan untuk baris tidak berurutan non-kontigu dalam normalisasi melalui OpenCL. Pembaruan ini merupakan bagian dari pengembangan berkelanjutan oleh tim ggml-org untuk meningkatkan kompatibilitas perangkat keras dan kinerja di berbagai platform. Rilis ini menyediakan biner untuk macOS Apple Silicon, Mac Intel, dan XCFrameworks iOS. Pengguna Linux dapat mengakses build untuk arsitektur Ubuntu x64, arm64, dan s390x menggunakan backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL. Dukungan Android tersedia untuk perangkat CPU arm64, sementara Windows menawarkan berbagai pilihan termasuk CPU, CUDA 12 dan 13, Vulkan, OpenVINO, SYCL, dan HIP. Rilis ini juga mencantumkan build yang dinonaktifkan untuk KleidiAI di platform macOS dan openEuler.

github llama.cpp · 7 hari lalu

Rilis llama.cpp b9785 dengan Pemeriksaan Caps yang Diperkuat dan Binari Multi-Platform

Proyek llama.cpp telah merilis versi b9785, menampilkan perubahan kode untuk memperkuat pemeriksaan caps sebagaimana dijelaskan dalam pull request #24973. Pembaruan ini menyediakan binari pra-dibangun untuk macOS Apple Silicon, Mac Intel, dan iOS melalui XCFramework, dengan dukungan KleidiAI dinonaktifkan pada Apple Silicon. Distribusi Linux termasuk Ubuntu didukung untuk backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL di seluruh arsitektur x64, arm64, dan s390x. Pengguna Android dapat mengakses binari CPU arm64, sementara Windows menawarkan berbagai pilihan mencakup CPU, OpenCL Adreno, CUDA 12 dan 13, Vulkan, OpenVINO, SYCL, dan HIP. Rilis ini juga menyertakan build untuk openEuler yang menargetkan prosesor x86 dan aarch64 dengan dukungan ACL Graph. Paket UI mandiri tersedia alongside rilis spesifik platform untuk memfasilitasi inferensi model lokal.

lab Claude Code Releases · 7 hari lalu

Catatan Rilis Claude Code v2.1.191

Claude Code versi 2.1.191 memperkenalkan dukungan /rewind, memungkinkan pengguna melanjutkan percakapan dari sebelum perintah /clear dieksekusi. Pembaruan ini memperbaiki beberapa masalah kritis, termasuk agen latar belakang yang bangkit kembali setelah dihentikan dan lompatan posisi gulir selama respons streaming. Ini juga memperbaiki perilaku di mana /voice menampilkan pesan kesalahan generik dan di mana URL /login terpotong di Windows Terminal. Peningkatan signifikan meningkatkan keandalan untuk server MCP dengan menambahkan logika percobaan ulang untuk kesalahan jaringan sementara selama penemuan kemampuan dan alur OAuth. Lingkungan headless sekarang melewati popup browser untuk OAuth, sementara izin jaringan sandbox diingat sepanjang durasi sesi. Optimisasi kinerja mengurangi penggunaan CPU selama streaming sekitar 37% melalui penggabungan pembaruan teks dan mengurangi pertumbuhan memori jangka panjang dari cache output terminal.

github LlamaIndex · 7 hari lalu

Catatan Rilis Llama Index v0.14.23

Llama Index merilis versi 0.14.23 pada 24 Juni 2026, memperkenalkan kemampuan multimodal yang signifikan dan berbagai perbaikan bug. Pembaruan inti mencakup fitur sintesis multimodal dan pengenalan mesin kueri multimodal untuk mendukung beragam jenis data. Perbaikan utama menangani penanganan blok dokumen dan video dalam output FunctionTool serta memastikan blok memori berbasis URL dipertahankan dengan benar. Peningkatan kinerja diimplementasikan dengan menggunakan set untuk deduplikasi dalam batch pada pipeline ingest dan mengoptimalkan logika pemisahan teks token. Rilis ini juga menyelesaikan ZeroDivisionError pada urutan input kosong dan memperbaiki kesalahan rekursi dalam pemisah ketika unit melebihi ukuran chunk. Selain itu, pengkodean UTF-8 eksplisit ditambahkan ke operasi I/O file, dan penyalinan mendalam dari keadaan awal mencegah kebocoran mutasi di seluruh jalankan alur kerja.

github CrewAI · 7 hari lalu

Catatan Rilis v1.14.8a4

v1.14.8a4 menambahkan dukungan alur percakapan di CLI TUI. Ini mencakup perbaikan untuk traversal jalur symlink selama ekstraksi dan validasi arsip keterampilan, serta validasi jalur definisi alur deklaratif. Dokumentasi untuk v1.14.8a3 telah diperbarui.

github llama.cpp · 7 hari lalu

LLaMA.cpp Rilis b9784: Optimisasi MM Hexagon dan Binari Lintas Platform

LLaMA.cpp merilis versi b9784 dengan optimisasi besar untuk operasi MM berbasis hexagon, termasuk repacking bobot bertiling 32x32, penanganan dyn.quant yang lebih baik, dan manajemen parameter kernel yang terpadu. Rilis ini mencakup binari baru untuk macOS (arm64 dan x64), iOS, dan berbagai arsitektur Linux dengan dukungan Vulkan, ROCm, dan OpenVINO.

github llama.cpp · 7 hari lalu

llama.cpp merilis b9782 dengan biner baru dan dukungan

llama.cpp merilis versi b9782, termasuk biner untuk macOS, Linux, Android, Windows, dan openEuler. Rilis ini menambahkan dukungan untuk Vulkan, OpenVINO, SYCL, ROCm, dan CUDA di berbagai arsitektur, dengan antarmuka pengguna yang diperbarui dan fitur-fitur dinonaktifkan seperti dukungan KleidiAI dan openEuler.

lab Google DeepMind Blog · 7 hari lalu

Gemini 3.5 Flash Menambahkan Kemampuan Penggunaan Komputer

Google telah memperkenalkan penggunaan komputer di Gemini 3.5 Flash, memungkinkan model untuk mengeksekusi kode dan berinteraksi dengan alat eksternal. Fitur ini memungkinkan pengguna menjalankan tugas pemrograman dan mengakses informasi secara real-time melalui fungsi komputasi terintegrasi.