Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 19

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

Rilis llama.cpp b9850: perbaikan Qwen3 dan biner baru

Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.

lab Anthropic News · 2 hari lalu

Claude Science, sebuah workbench AI untuk ilmuwan, kini tersedia

Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.

lab Anthropic News · 2 hari lalu

Memperkenalkan Claude Sonnet 5

Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.

lab Claude Code Releases · 2 hari lalu

Claude Code v2.1.197 memperkenalkan Claude Sonnet 5

Anthropic telah merilis versi 2.1.197 dari Claude Code, yang memperbarui model default menjadi Claude Sonnet 5. Model baru ini memiliki jendela konteks native 1M-token dan tersedia dengan harga promosi hingga 31 Agustus.

lab OpenAI News · 2 hari lalu

Di Dalam GeneBench-Pro: 10 Studi Kasus Penalaran Genomik Kompleks

GeneBench-Pro adalah benchmark yang dirancang untuk mengevaluasi model pada tugas penalaran genomik kompleks, menampilkan sepuluh studi kasus terperinci yang menunjukkan pertanyaan representatif dan materi pendukung. Setiap studi kasus menyediakan prompt asli, dataset, dan konteks yang diperlukan untuk menilai kinerja model pada tantangan biologis spesifik.

lab OpenAI News · 2 hari lalu

Memperkenalkan GeneBench-Pro

GeneBench-Pro adalah benchmark tingkat penelitian yang dirancang untuk mengukur bagaimana agen AI menangani ambiguitas dan membuat penilaian konsekuensial dalam biologi komputasi, dengan memperluas dari GeneBench asli. Ini mengatasi keterbatasan evaluasi saat ini dengan menguji kemampuan tingkat tinggi seperti menangani noise data, merevisi asumsi, dan menentukan kapan hasil siap untuk pengambilan keputusan.

lab OpenAI News · 2 hari lalu

Epidemiologi core dump: memperbaiki bug berusia 18 tahun

Insinyur OpenAI mengatasi crash C++ yang tidak dapat dijelaskan dalam infrastruktur data Rockset mereka dengan mengidentifikasi dua penyebab berbeda: korupsi perangkat keras diam-diam pada host Azure dan race condition berusia 18 tahun di GNU libunwind.

lab OpenAI News · 2 hari lalu

Bagaimana adopsi ChatGPT telah meluas

Data dari OpenAI Signals menunjukkan bahwa adopsi ChatGPT semakin meluas dan mendalam secara global, dengan pengguna mengirim pesan harian 50% lebih banyak dan menggandakan jumlah tugas berbeda yang dicoba enam bulan setelah mendaftar.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9849: Penanganan URL IPv6 dan biner baru

Rilis llama.cpp b9849 memperkenalkan dukungan untuk literal IPv6 yang diapit kurung siku dalam otoritas URL, memungkinkan server menguraikan bentuk [host]:port sesuai RFC 3986. Pembaruan ini memastikan pemformatan log pendengaran, header proxy, dan pembangunan ulang klien dengan benar sambil mempertahankan bare remote_addr untuk pelacakan per permintaan.

lab Google DeepMind Blog · 2 hari lalu

Mulai membangun dengan Nano Banana 2 Lite dan Gemini Omni Flash

Google telah merilis dua model AI baru, Nano Banana 2 Lite dan Gemini Omni Flash, yang dirancang untuk meningkatkan kemampuan pengembang dalam membangun aplikasi cerdas.

lab Hugging Face Blog · 2 hari lalu

Mengapa Spesialisasi Adalah Keniscayaan

Artikel ini berargumen bahwa spesialisasi dalam pembelajaran mesin adalah tren yang tak terhindarkan, didorong oleh meningkatnya kompleksitas model dan kebutuhan akan keahlian spesifik domain.

github llama.cpp · 2 hari lalu

Rilis b9848 llama.cpp memperbaiki get_rows_back CUDA dan menyediakan biner

Proyek llama.cpp telah merilis versi b9848, yang mencakup perbaikan kritis untuk backend CUDA guna menyelesaikan masalah dengan fungsi `get_rows_back` pada tabel yang melebihi 65535 baris. Pembaruan ini mengatasi kesalahan pengikatan grid-y dan stride yang sebelumnya memengaruhi operasi tabel besar.

lab Hugging Face Blog · 2 hari lalu

Menampilkan Hasil Every Eval di Halaman Model Hugging Face

Hugging Face telah memperbarui halaman modelnya untuk menampilkan hasil evaluasi dari inisiatif 'Every Eval', memberikan pandangan komprehensif tentang kinerja model di berbagai benchmark. Integrasi ini memungkinkan pengguna mengakses berbagai metrik terstandarisasi langsung dalam antarmuka hub model.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9847 memperbaiki Gemma E4B MTP FlashAttention

Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.

media Hugging Face Forums · 2 hari lalu

Trajlens: validator untuk LeRobotDataset, 100 dataset Hub diaudit

Penulis memperkenalkan Trajlens, sebuah linter open-source untuk kategori LeRobotDataset di Hugging Face Hub, dan melaporkan hasil dari audit terhadap 100 dataset publik acak yang ditandai dengan 'lerobot'. Audit mengungkapkan bahwa hanya 19 dataset yang lulus validasi, sementara 13 gagal karena bug hulu spesifik dan 47 mengalami kesalahan pemuatan atau timeout.

media Hugging Face Forums · 2 hari lalu

Proposal Arsitektur: Jaringan Adversarial Epistemologis (EAN) untuk AI Sumber Terbuka

Sebuah permintaan fitur mengusulkan Jaringan Adversarial Epistemologis (EAN), sebuah arsitektur yang dirancang untuk mengubah AI dari sistem yang mencerminkan konsensus institusional menjadi mesin verifikasi terdesentralisasi dan multi-perspektif. Pendekatan ini bertujuan menghilangkan permainan kekuasaan politik dan korporat dengan menghapus model "sumber kebenaran" tunggal.

media Hugging Face Forums · 2 hari lalu

Diskusi Komunitas tentang LLM Open-Source untuk Pengembangan Chatbot

Sebuah thread diskusi di forum Hugging Face meminta pengguna mengenai model AI gratis atau open-source apa yang mereka gunakan saat ini untuk pengembangan chatbot dan alasan preferensi mereka.

media Hugging Face Forums · 2 hari lalu

5 model terbaik yang bisa saya jalankan dengan perangkat keras saya? Tanpa lobotomisasi AI

Seorang pengguna di forum Hugging Face mencari rekomendasi untuk model AI tanpa sensor yang mampu bernalar tentang topik kompleks, dengan menyebutkan preferensi terhadap versi awal GPT-4 dibandingkan iterasi saat ini.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9846 dengan optimasi matmul Vulkan untuk Asahi Linux

Proyek llama.cpp telah merilis versi b9846, yang mencakup optimasi backend Vulkan untuk Asahi Linux. Pembaruan ini mengembalikan loop ukuran blok dalam perkalian matriks untuk meningkatkan kompatibilitas dan kinerja pada perangkat keras Apple Silicon yang menjalankan Linux.