v0.24.0
Rilis v0.24.0 mencakup pembaruan integrasi berkelanjutan untuk meningkatkan batas waktu awal GSM8K pada konfigurasi MoE Refactor Qwen3 NVFP4.
Rilis v0.24.0 mencakup pembaruan integrasi berkelanjutan untuk meningkatkan batas waktu awal GSM8K pada konfigurasi MoE Refactor Qwen3 NVFP4.
OpenAI telah memulai pratinjau terbatas untuk seri GPT-5.6, memperkenalkan tiga model baru: Sol sebagai unggulan utama, Terra untuk pekerjaan sehari-hari yang seimbang, dan Luna untuk tugas cepat dan terjangkau. Perusahaan berencana membuat model-model ini tersedia secara umum dalam beberapa minggu mendatang setelah fase awal ini dengan mitra terpercaya.
Claude Code versi 2.1.195 memperkenalkan beberapa perbaikan dan peningkatan, termasuk variabel lingkungan baru untuk kontrol mouse dalam mode layar penuh serta koreksi pada logika pencocok hook.
SDK Python Model Context Protocol (MCP) telah merilis versi alpha ketiganya, v2.0.0a3, yang memperkenalkan perubahan signifikan pada protokol dan arsitektur sambil mempertahankan kompatibilitas mundur bagi pengguna stabil 1.x.
SDK Python Model Context Protocol telah merilis versi 1.28.1, memperkenalkan pembaruan pada penanganan aliran dan keamanan transportasi.
Artikel ini mengumumkan rilis versi 0.5.14.
Claude Code versi 2.1.193 memperkenalkan beberapa peningkatan pada klasifikasi mode otomatis, pencatatan telemetri, dan manajemen agen latar belakang. Pembaruan ini juga mencakup perbaikan untuk masalah status UI, penanganan autentikasi di server MCP, serta berbagai bug latar belakang.
Artikel ini menggambarkan metode untuk mengotomatisasi pemeliharaan fork perangkat lunak menggunakan agen kode AI, menerapkannya pada fork Cohere dari vLLM. Pendekatan ini memangkas waktu yang dibutuhkan untuk menyerap rilis upstream dari minggu menjadi hari dengan mengganti intervensi manual dengan loop umpan balik otomatis.
Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.
Google Finance secara resmi meninggalkan fase betanya dan meluncurkan aplikasi khusus untuk perangkat Android.
Rilis kandidat ini memperbaiki fungsionalitas Prefill/Decode (P/D) yang bekerja bersama Supervisor Data Parallelism (DP) dalam proyek vLLM.
Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.
Sebuah makalah riset baru dari OpenAI menunjukkan bagaimana agen kecerdasan buatan secara fundamental mengubah sifat pekerjaan. Studi ini menyoroti kemampuan agen-agen tersebut untuk menjalankan tugas yang lebih panjang dan kompleks daripada yang sebelumnya memungkinkan. Kemajuan teknologi ini dianggap telah meningkatkan produktivitas di berbagai peran profesional. Temuan ini mengindikasikan pergeseran signifikan dalam cara kerja diatur dan dilakukan melalui otomatisasi. Dengan menangani alur kerja yang rumit, agen AI memungkinkan pengguna mencapai efisiensi yang lebih besar. Makalah ini menjadi bukti dari dampak yang semakin besar dari sistem otonom terhadap pekerjaan modern.
Claude Code versi 2.1.191 memperkenalkan dukungan /rewind, memungkinkan pengguna melanjutkan percakapan dari sebelum perintah /clear dieksekusi. Pembaruan ini memperbaiki beberapa masalah kritis, termasuk agen latar belakang yang bangkit kembali setelah dihentikan dan lompatan posisi gulir selama respons streaming. Ini juga memperbaiki perilaku di mana /voice menampilkan pesan kesalahan generik dan di mana URL /login terpotong di Windows Terminal. Peningkatan signifikan meningkatkan keandalan untuk server MCP dengan menambahkan logika percobaan ulang untuk kesalahan jaringan sementara selama penemuan kemampuan dan alur OAuth. Lingkungan headless sekarang melewati popup browser untuk OAuth, sementara izin jaringan sandbox diingat sepanjang durasi sesi. Optimisasi kinerja mengurangi penggunaan CPU selama streaming sekitar 37% melalui penggabungan pembaruan teks dan mengurangi pertumbuhan memori jangka panjang dari cache output terminal.
Google telah memperkenalkan penggunaan komputer di Gemini 3.5 Flash, memungkinkan model untuk mengeksekusi kode dan berinteraksi dengan alat eksternal. Fitur ini memungkinkan pengguna menjalankan tugas pemrograman dan mengakses informasi secara real-time melalui fungsi komputasi terintegrasi.
Versi 2.1.190 mencakup perbaikan bug dan peningkatan keandalan. Tidak ada fitur baru yang diumumkan dalam pembaruan ini.
Mistral Studio kini menawarkan kontrol admin yang diperkaya untuk mengatur akses konektor per ruang kerja dan alat, memungkinkan izin yang lebih terperinci. Fitur termasuk kunci API dengan cakupan, konektor multi-akun, dan Debugger Konektor baru untuk analisis akar masalah, semuanya mendukung integrasi yang aman dan dapat diaudit dengan sistem perusahaan.
Talos adalah alat open-source yang mengotomatisasi analisis ulang iteratif data genomik untuk mengidentifikasi diagnosis penyakit langka. Alat ini mencapai tingkat pemulihan diagnosis dalam cakupan sebesar 90% dengan hanya 1,3 varian kandidat per pasien, serta memberikan 241 diagnosis baru di antara 5.000 pasien yang belum terdiagnosis, dengan sebagian besar temuan baru muncul dalam waktu 32 hari sejak publikasi bukti.
OpenAI dan Broadcom telah memperkenalkan Jalapeño, sebuah chip AI kustom yang dirancang untuk inferensi model bahasa besar. Chip ini bertujuan meningkatkan kinerja, efisiensi, dan skalabilitas dalam sistem AI.
vllm merilis v0.24.0rc1, termasuk perbaikan untuk masalah pembuatan histogram topk pada SM75. Perubahan ini di-cherry-pick dari commit 191826e dan disetujui oleh Mohammad Miadh Angkad.