Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 16

Catatan Rilis MCP Python SDK v2.0.0a3

SDK Python Model Context Protocol (MCP) telah merilis versi alpha ketiganya, v2.0.0a3, yang memperkenalkan perubahan signifikan pada protokol dan arsitektur sambil mempertahankan kompatibilitas mundur bagi pengguna stabil 1.x.

media Hugging Face Forums · 6 hari lalu

eBPF di Go: Observabilitas untuk Layanan yang Dihasilkan AI

Artikel ini menyajikan tutorial tentang penggunaan eBPF dengan Go untuk mencapai observabilitas tingkat kernel, mengatasi kurangnya visibilitas saat men-debug masalah produksi dalam layanan yang dihasilkan AI.

github llama.cpp · 6 hari lalu

Rilis llama.cpp b9804: Perbaikan Mamba2 dan biner baru

Rilis llama.cpp b9804 memperkenalkan perbaikan untuk arsitektur Mamba2 dengan menghapus faktor ekspansi 2x yang di-hardcode dan pemeriksaan parameter yang tidak valid, sehingga mendukung nilai expand apa pun. Perubahan ini memperbarui skrip `convert_hf_to_gguf.py` agar parameter expand bersifat opsional dengan nilai default 2.

media Hugging Face Forums · 6 hari lalu

JoeBro: ruang kerja AI asli macOS tanpa dependensi

JoeBro adalah aplikasi macOS asli yang berfokus pada lokal, dirancang untuk menyediakan ruang kerja AI tanpa memerlukan dependensi eksternal seperti pip atau Docker. Aplikasi ini memiliki backend Python bawaan dan penyimpanan SQLite untuk memastikan semua data tetap berada di mesin pengguna, menghilangkan kebutuhan telemetri dan akun.

media Hugging Face Forums · 6 hari lalu

Bagaimana cara menambahkan seseorang ke dataset/database Hugging Face?

Konten sumber yang disediakan menunjukkan bahwa topik postingan asli telah dihapus oleh penulis. Akibatnya, tidak ada informasi spesifik mengenai proses menambahkan pengguna ke dataset atau database Hugging Face yang tersedia dalam kutipan ini.

github CrewAI · 6 hari lalu

Catatan Rilis crewAI 1.15.0

Rilis crewAI 1.15.0 memperkenalkan peningkatan signifikan pada definisi Flow, termasuk pemuatan deklaratif terpadu, dukungan inline crew, dan tindakan komposit baru seperti `each` dan tindakan agen tunggal.

github llama.cpp · 6 hari lalu

Rilis llama.cpp b9803 dengan perbaikan profil OpenCL

Proyek llama.cpp telah merilis versi b9803, yang mencakup perbaikan untuk OpenCL guna flushing batch profil saat shutdown untuk batch yang tidak lengkap. Pembaruan ini menyediakan biner untuk macOS, Linux, Windows, Android, dan openEuler di berbagai backend perangkat keras.

github AutoGPT · 6 hari lalu

Catatan Rilis Beta Platforma AutoGPT v0.6.65

Platforma AutoGPT telah merilis versi 0.6.65, memperkenalkan pembaruan signifikan pada sistem Copilot, navigasi antarmuka pengguna, dan keandalan infrastruktur.

github llama.cpp · 6 hari lalu

Rilis b9802 llama.cpp menyediakan biner untuk macOS, Linux, Windows, dan Android

Proyek llama.cpp telah menerbitkan rilis b9802, menawarkan biner yang sudah dibangun di berbagai sistem operasi dan arsitektur perangkat keras. Pembaruan ini mencakup dukungan untuk CPU, GPU, dan akselerator AI khusus pada platform seperti macOS, Linux, Windows, Android, dan openEuler.

github SGLang · 6 hari lalu

v0.5.14

Artikel ini mengumumkan rilis versi 0.5.14.

lab Claude Code Releases · 7 hari lalu

Catatan Rilis Claude Code v2.1.193

Claude Code versi 2.1.193 memperkenalkan beberapa peningkatan pada klasifikasi mode otomatis, pencatatan telemetri, dan manajemen agen latar belakang. Pembaruan ini juga mencakup perbaikan untuk masalah status UI, penanganan autentikasi di server MCP, serta berbagai bug latar belakang.

lab Cohere Blog · 7 hari lalu

Mengotomatisasi pemeliharaan fork dengan agen AI

Artikel ini menggambarkan metode untuk mengotomatisasi pemeliharaan fork perangkat lunak menggunakan agen kode AI, menerapkannya pada fork Cohere dari vLLM. Pendekatan ini memangkas waktu yang dibutuhkan untuk menyerap rilis upstream dari minggu menjadi hari dengan mengganti intervensi manual dengan loop umpan balik otomatis.

github Goose (Block) · 7 hari lalu

v1.39.0

Rilis ini mencoba memperbaiki build Flatpak.

lab Microsoft Research Blog · 7 hari lalu

Memahami otak dengan penjelasan dan eksperimen berbasis AI

Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.

lab Google — The Keyword (AI) · 7 hari lalu

Google Finance keluar dari fase beta dengan aplikasi Android baru

Google Finance secara resmi meninggalkan fase betanya dan meluncurkan aplikasi khusus untuk perangkat Android.

lab Hugging Face Blog · 7 hari lalu

Jalankan Server vLLM di HF Jobs dengan Satu Perintah

Hugging Face telah memperkenalkan fitur baru yang memungkinkan pengguna untuk men-deploy server vLLM secara langsung melalui platform Hugging Face Jobs menggunakan satu perintah.

github vLLM · 7 hari lalu

v0.24.0rc2: Perbaiki P/D dengan Supervisor DP (#46628)

Rilis kandidat ini memperbaiki fungsionalitas Prefill/Decode (P/D) yang bekerja bersama Supervisor Data Parallelism (DP) dalam proyek vLLM.

github CrewAI · 7 hari lalu

Catatan Rilis crewAI 1.14.8a5

Pembaruan versi 1.14.8a5 dari crewAI memperkenalkan perubahan pada manajemen keadaan aliran, pembaruan dokumentasi, dan upaya refactoring.

lab Hugging Face Blog · 7 hari lalu

Analisis Akurasi Prediksi Token dalam Model Bahasa Hibrida

Sebuah studi terbaru menyelidiki token spesifik mana yang diprediksi lebih akurat oleh model bahasa hibrida dibandingkan dengan arsitektur padat standar. Penelitian ini berfokus pada pemahaman distribusi kesalahan prediksi di berbagai jenis token, seperti kata langka dan cuplikan kode. Dengan menganalisis lanskap kerugian, penulis mengidentifikasi bahwa model hibrida unggul dalam menangkap ketergantungan jarak jauh di wilayah data jarang. Temuan tersebut menunjukkan bahwa mekanisme campuran ahli memungkinkan pemanfaatan parameter yang lebih efisien selama inferensi. Akurasi yang meningkat ini sangat mencolok untuk token dengan frekuensi rendah dalam korpus pelatihan. Makalah ini memberikan rincian mendetail dari metrik kinerja di berbagai dataset benchmark. Hasil-hasil ini menyoroti potensi arsitektur hibrida untuk menangani struktur linguistik yang beragam secara efektif.

lab Cohere Blog · 7 hari lalu

Cohere Otomatisasi Tanggap Insiden dengan North dan Wiz melalui Server MCP Kustom

Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.