Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 13

media Together AI Blog · 1 jam lalu Langsung

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

ScarfBench: Benchmarking Agen AI untuk Migrasi Framework Java Enterprise

Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.

github llama.cpp · 23 jam lalu

Rilis llama.cpp b9850: perbaikan Qwen3 dan biner baru

Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.

lab Anthropic News · 1 hari lalu

Claude Science, sebuah workbench AI untuk ilmuwan, kini tersedia

Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.

lab Anthropic News · 1 hari lalu

Memperkenalkan Claude Sonnet 5

Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.

lab Claude Code Releases · 1 hari lalu

Claude Code v2.1.197 memperkenalkan Claude Sonnet 5

Anthropic telah merilis versi 2.1.197 dari Claude Code, yang memperbarui model default menjadi Claude Sonnet 5. Model baru ini memiliki jendela konteks native 1M-token dan tersedia dengan harga promosi hingga 31 Agustus.

lab OpenAI News · 1 hari lalu

Di Dalam GeneBench-Pro: 10 Studi Kasus Penalaran Genomik Kompleks

GeneBench-Pro adalah benchmark yang dirancang untuk mengevaluasi model pada tugas penalaran genomik kompleks, menampilkan sepuluh studi kasus terperinci yang menunjukkan pertanyaan representatif dan materi pendukung. Setiap studi kasus menyediakan prompt asli, dataset, dan konteks yang diperlukan untuk menilai kinerja model pada tantangan biologis spesifik.

lab OpenAI News · 1 hari lalu

Memperkenalkan GeneBench-Pro

GeneBench-Pro adalah benchmark tingkat penelitian yang dirancang untuk mengukur bagaimana agen AI menangani ambiguitas dan membuat penilaian konsekuensial dalam biologi komputasi, dengan memperluas dari GeneBench asli. Ini mengatasi keterbatasan evaluasi saat ini dengan menguji kemampuan tingkat tinggi seperti menangani noise data, merevisi asumsi, dan menentukan kapan hasil siap untuk pengambilan keputusan.

lab OpenAI News · 1 hari lalu

Epidemiologi core dump: memperbaiki bug berusia 18 tahun

Insinyur OpenAI mengatasi crash C++ yang tidak dapat dijelaskan dalam infrastruktur data Rockset mereka dengan mengidentifikasi dua penyebab berbeda: korupsi perangkat keras diam-diam pada host Azure dan race condition berusia 18 tahun di GNU libunwind.

lab OpenAI News · 1 hari lalu

Bagaimana adopsi ChatGPT telah meluas

Data dari OpenAI Signals menunjukkan bahwa adopsi ChatGPT semakin meluas dan mendalam secara global, dengan pengguna mengirim pesan harian 50% lebih banyak dan menggandakan jumlah tugas berbeda yang dicoba enam bulan setelah mendaftar.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9849: Penanganan URL IPv6 dan biner baru

Rilis llama.cpp b9849 memperkenalkan dukungan untuk literal IPv6 yang diapit kurung siku dalam otoritas URL, memungkinkan server menguraikan bentuk [host]:port sesuai RFC 3986. Pembaruan ini memastikan pemformatan log pendengaran, header proxy, dan pembangunan ulang klien dengan benar sambil mempertahankan bare remote_addr untuk pelacakan per permintaan.

lab Google DeepMind Blog · 1 hari lalu

Mulai membangun dengan Nano Banana 2 Lite dan Gemini Omni Flash

Google telah merilis dua model AI baru, Nano Banana 2 Lite dan Gemini Omni Flash, yang dirancang untuk meningkatkan kemampuan pengembang dalam membangun aplikasi cerdas.

lab Hugging Face Blog · 1 hari lalu

Mengapa Spesialisasi Adalah Keniscayaan

Artikel ini berargumen bahwa spesialisasi dalam pembelajaran mesin adalah tren yang tak terhindarkan, didorong oleh meningkatnya kompleksitas model dan kebutuhan akan keahlian spesifik domain.

github llama.cpp · 1 hari lalu

Rilis b9848 llama.cpp memperbaiki get_rows_back CUDA dan menyediakan biner

Proyek llama.cpp telah merilis versi b9848, yang mencakup perbaikan kritis untuk backend CUDA guna menyelesaikan masalah dengan fungsi `get_rows_back` pada tabel yang melebihi 65535 baris. Pembaruan ini mengatasi kesalahan pengikatan grid-y dan stride yang sebelumnya memengaruhi operasi tabel besar.

lab Hugging Face Blog · 1 hari lalu

Menampilkan Hasil Every Eval di Halaman Model Hugging Face

Hugging Face telah memperbarui halaman modelnya untuk menampilkan hasil evaluasi dari inisiatif 'Every Eval', memberikan pandangan komprehensif tentang kinerja model di berbagai benchmark. Integrasi ini memungkinkan pengguna mengakses berbagai metrik terstandarisasi langsung dalam antarmuka hub model.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9847 memperbaiki Gemma E4B MTP FlashAttention

Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9846 dengan optimasi matmul Vulkan untuk Asahi Linux

Proyek llama.cpp telah merilis versi b9846, yang mencakup optimasi backend Vulkan untuk Asahi Linux. Pembaruan ini mengembalikan loop ukuran blok dalam perkalian matriks untuk meningkatkan kompatibilitas dan kinerja pada perangkat keras Apple Silicon yang menjalankan Linux.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9844 menambahkan dukungan NVFP4 dan biner baru

Proyek llama.cpp telah merilis versi b9844, yang memperkenalkan dukungan ggml-webgpu untuk format kuantisasi NVFP4. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

lab Google — The Keyword (AI) · 2 hari lalu

Membuka era produktivitas berikutnya di Inggris: Membangun bangsa pelopor AI

Google UK telah merilis Laporan Dampak Ekonominya yang terbaru, yang merinci strategi untuk membantu lebih banyak orang memanfaatkan manfaat teknologi berbasis AI di negara tersebut.

github llama.cpp · 2 hari lalu

Rilis b9843 llama.cpp dengan biner untuk macOS, Linux, Windows

Proyek llama.cpp telah menerbitkan rilis b9843, menyediakan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur perangkat keras.