Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 4

v0.24.0

Rilis v0.24.0 mencakup pembaruan integrasi berkelanjutan untuk meningkatkan batas waktu awal GSM8K pada konfigurasi MoE Refactor Qwen3 NVFP4.

lab OpenAI News · 4 hari lalu

OpenAI memamerkan model GPT-5.6 Sol, Terra, dan Luna

OpenAI telah memulai pratinjau terbatas untuk seri GPT-5.6, memperkenalkan tiga model baru: Sol sebagai unggulan utama, Terra untuk pekerjaan sehari-hari yang seimbang, dan Luna untuk tugas cepat dan terjangkau. Perusahaan berencana membuat model-model ini tersedia secara umum dalam beberapa minggu mendatang setelah fase awal ini dengan mitra terpercaya.

lab Claude Code Releases · 4 hari lalu

Catatan Rilis Claude Code v2.1.195

Claude Code versi 2.1.195 memperkenalkan beberapa perbaikan dan peningkatan, termasuk variabel lingkungan baru untuk kontrol mouse dalam mode layar penuh serta koreksi pada logika pencocok hook.

github MCP (GitHub org) · 5 hari lalu

Catatan Rilis MCP Python SDK v2.0.0a3

SDK Python Model Context Protocol (MCP) telah merilis versi alpha ketiganya, v2.0.0a3, yang memperkenalkan perubahan signifikan pada protokol dan arsitektur sambil mempertahankan kompatibilitas mundur bagi pengguna stabil 1.x.

github MCP (GitHub org) · 5 hari lalu

Rilis SDK Python Model Context Protocol v1.28.1

SDK Python Model Context Protocol telah merilis versi 1.28.1, memperkenalkan pembaruan pada penanganan aliran dan keamanan transportasi.

github SGLang · 5 hari lalu

v0.5.14

Artikel ini mengumumkan rilis versi 0.5.14.

lab Claude Code Releases · 5 hari lalu

Catatan Rilis Claude Code v2.1.193

Claude Code versi 2.1.193 memperkenalkan beberapa peningkatan pada klasifikasi mode otomatis, pencatatan telemetri, dan manajemen agen latar belakang. Pembaruan ini juga mencakup perbaikan untuk masalah status UI, penanganan autentikasi di server MCP, serta berbagai bug latar belakang.

lab Cohere Blog · 5 hari lalu

Mengotomatisasi pemeliharaan fork dengan agen AI

Artikel ini menggambarkan metode untuk mengotomatisasi pemeliharaan fork perangkat lunak menggunakan agen kode AI, menerapkannya pada fork Cohere dari vLLM. Pendekatan ini memangkas waktu yang dibutuhkan untuk menyerap rilis upstream dari minggu menjadi hari dengan mengganti intervensi manual dengan loop umpan balik otomatis.

lab Microsoft Research Blog · 5 hari lalu

Memahami otak dengan penjelasan dan eksperimen berbasis AI

Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.

lab Google — The Keyword (AI) · 5 hari lalu

Google Finance keluar dari fase beta dengan aplikasi Android baru

Google Finance secara resmi meninggalkan fase betanya dan meluncurkan aplikasi khusus untuk perangkat Android.

github vLLM · 5 hari lalu

v0.24.0rc2: Perbaiki P/D dengan Supervisor DP (#46628)

Rilis kandidat ini memperbaiki fungsionalitas Prefill/Decode (P/D) yang bekerja bersama Supervisor Data Parallelism (DP) dalam proyek vLLM.

lab Cohere Blog · 6 hari lalu

Cohere Otomatisasi Tanggap Insiden dengan North dan Wiz melalui Server MCP Kustom

Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.

lab OpenAI News · 6 hari lalu

Riset OpenAI Menunjukkan Agen AI Mengubah Pekerjaan

Sebuah makalah riset baru dari OpenAI menunjukkan bagaimana agen kecerdasan buatan secara fundamental mengubah sifat pekerjaan. Studi ini menyoroti kemampuan agen-agen tersebut untuk menjalankan tugas yang lebih panjang dan kompleks daripada yang sebelumnya memungkinkan. Kemajuan teknologi ini dianggap telah meningkatkan produktivitas di berbagai peran profesional. Temuan ini mengindikasikan pergeseran signifikan dalam cara kerja diatur dan dilakukan melalui otomatisasi. Dengan menangani alur kerja yang rumit, agen AI memungkinkan pengguna mencapai efisiensi yang lebih besar. Makalah ini menjadi bukti dari dampak yang semakin besar dari sistem otonom terhadap pekerjaan modern.

lab Claude Code Releases · 6 hari lalu

Catatan Rilis Claude Code v2.1.191

Claude Code versi 2.1.191 memperkenalkan dukungan /rewind, memungkinkan pengguna melanjutkan percakapan dari sebelum perintah /clear dieksekusi. Pembaruan ini memperbaiki beberapa masalah kritis, termasuk agen latar belakang yang bangkit kembali setelah dihentikan dan lompatan posisi gulir selama respons streaming. Ini juga memperbaiki perilaku di mana /voice menampilkan pesan kesalahan generik dan di mana URL /login terpotong di Windows Terminal. Peningkatan signifikan meningkatkan keandalan untuk server MCP dengan menambahkan logika percobaan ulang untuk kesalahan jaringan sementara selama penemuan kemampuan dan alur OAuth. Lingkungan headless sekarang melewati popup browser untuk OAuth, sementara izin jaringan sandbox diingat sepanjang durasi sesi. Optimisasi kinerja mengurangi penggunaan CPU selama streaming sekitar 37% melalui penggabungan pembaruan teks dan mengurangi pertumbuhan memori jangka panjang dari cache output terminal.

lab Google DeepMind Blog · 7 hari lalu

Gemini 3.5 Flash Menambahkan Kemampuan Penggunaan Komputer

Google telah memperkenalkan penggunaan komputer di Gemini 3.5 Flash, memungkinkan model untuk mengeksekusi kode dan berinteraksi dengan alat eksternal. Fitur ini memungkinkan pengguna menjalankan tugas pemrograman dan mengakses informasi secara real-time melalui fungsi komputasi terintegrasi.

lab Claude Code Releases · 7 hari lalu

v2.1.190: Perbaikan bug dan peningkatan keandalan

Versi 2.1.190 mencakup perbaikan bug dan peningkatan keandalan. Tidak ada fitur baru yang diumumkan dalam pembaruan ini.

lab Mistral AI News · 7 hari lalu

Kontrol Konektor Baru untuk Keamanan dan Akses Perusahaan

Mistral Studio kini menawarkan kontrol admin yang diperkaya untuk mengatur akses konektor per ruang kerja dan alat, memungkinkan izin yang lebih terperinci. Fitur termasuk kunci API dengan cakupan, konektor multi-akun, dan Debugger Konektor baru untuk analisis akar masalah, semuanya mendukung integrasi yang aman dan dapat diaudit dengan sistem perusahaan.

lab Microsoft Research Blog · 7 hari lalu

Talos: Analisis Ulang Genom Otomatis untuk Diagnosis Penyakit Langka

Talos adalah alat open-source yang mengotomatisasi analisis ulang iteratif data genomik untuk mengidentifikasi diagnosis penyakit langka. Alat ini mencapai tingkat pemulihan diagnosis dalam cakupan sebesar 90% dengan hanya 1,3 varian kandidat per pasien, serta memberikan 241 diagnosis baru di antara 5.000 pasien yang belum terdiagnosis, dengan sebagian besar temuan baru muncul dalam waktu 32 hari sejak publikasi bukti.

lab OpenAI News · 7 hari lalu

OpenAI dan Broadcom meluncurkan chip inferensi yang dioptimalkan untuk LLM

OpenAI dan Broadcom telah memperkenalkan Jalapeño, sebuah chip AI kustom yang dirancang untuk inferensi model bahasa besar. Chip ini bertujuan meningkatkan kinerja, efisiensi, dan skalabilitas dalam sistem AI.

github vLLM · 7 hari lalu

v0.24.0rc1: Perbaiki pembuatan histogram topk pada SM75

vllm merilis v0.24.0rc1, termasuk perbaikan untuk masalah pembuatan histogram topk pada SM75. Perubahan ini di-cherry-pick dari commit 191826e dan disetujui oleh Mohammad Miadh Angkad.