Together AI di ICML 2026: riset frontier di seluruh tumpukan
Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.
Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.
Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.
Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.
Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.
Anthropic telah merilis versi 2.1.197 dari Claude Code, yang memperbarui model default menjadi Claude Sonnet 5. Model baru ini memiliki jendela konteks native 1M-token dan tersedia dengan harga promosi hingga 31 Agustus.
GeneBench-Pro adalah benchmark yang dirancang untuk mengevaluasi model pada tugas penalaran genomik kompleks, menampilkan sepuluh studi kasus terperinci yang menunjukkan pertanyaan representatif dan materi pendukung. Setiap studi kasus menyediakan prompt asli, dataset, dan konteks yang diperlukan untuk menilai kinerja model pada tantangan biologis spesifik.
GeneBench-Pro adalah benchmark tingkat penelitian yang dirancang untuk mengukur bagaimana agen AI menangani ambiguitas dan membuat penilaian konsekuensial dalam biologi komputasi, dengan memperluas dari GeneBench asli. Ini mengatasi keterbatasan evaluasi saat ini dengan menguji kemampuan tingkat tinggi seperti menangani noise data, merevisi asumsi, dan menentukan kapan hasil siap untuk pengambilan keputusan.
Insinyur OpenAI mengatasi crash C++ yang tidak dapat dijelaskan dalam infrastruktur data Rockset mereka dengan mengidentifikasi dua penyebab berbeda: korupsi perangkat keras diam-diam pada host Azure dan race condition berusia 18 tahun di GNU libunwind.
Data dari OpenAI Signals menunjukkan bahwa adopsi ChatGPT semakin meluas dan mendalam secara global, dengan pengguna mengirim pesan harian 50% lebih banyak dan menggandakan jumlah tugas berbeda yang dicoba enam bulan setelah mendaftar.
Rilis llama.cpp b9849 memperkenalkan dukungan untuk literal IPv6 yang diapit kurung siku dalam otoritas URL, memungkinkan server menguraikan bentuk [host]:port sesuai RFC 3986. Pembaruan ini memastikan pemformatan log pendengaran, header proxy, dan pembangunan ulang klien dengan benar sambil mempertahankan bare remote_addr untuk pelacakan per permintaan.
Google telah merilis dua model AI baru, Nano Banana 2 Lite dan Gemini Omni Flash, yang dirancang untuk meningkatkan kemampuan pengembang dalam membangun aplikasi cerdas.
Artikel ini berargumen bahwa spesialisasi dalam pembelajaran mesin adalah tren yang tak terhindarkan, didorong oleh meningkatnya kompleksitas model dan kebutuhan akan keahlian spesifik domain.
Proyek llama.cpp telah merilis versi b9848, yang mencakup perbaikan kritis untuk backend CUDA guna menyelesaikan masalah dengan fungsi `get_rows_back` pada tabel yang melebihi 65535 baris. Pembaruan ini mengatasi kesalahan pengikatan grid-y dan stride yang sebelumnya memengaruhi operasi tabel besar.
Hugging Face telah memperbarui halaman modelnya untuk menampilkan hasil evaluasi dari inisiatif 'Every Eval', memberikan pandangan komprehensif tentang kinerja model di berbagai benchmark. Integrasi ini memungkinkan pengguna mengakses berbagai metrik terstandarisasi langsung dalam antarmuka hub model.
Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.
Penulis memperkenalkan Trajlens, sebuah linter open-source untuk kategori LeRobotDataset di Hugging Face Hub, dan melaporkan hasil dari audit terhadap 100 dataset publik acak yang ditandai dengan 'lerobot'. Audit mengungkapkan bahwa hanya 19 dataset yang lulus validasi, sementara 13 gagal karena bug hulu spesifik dan 47 mengalami kesalahan pemuatan atau timeout.
Sebuah permintaan fitur mengusulkan Jaringan Adversarial Epistemologis (EAN), sebuah arsitektur yang dirancang untuk mengubah AI dari sistem yang mencerminkan konsensus institusional menjadi mesin verifikasi terdesentralisasi dan multi-perspektif. Pendekatan ini bertujuan menghilangkan permainan kekuasaan politik dan korporat dengan menghapus model "sumber kebenaran" tunggal.
Sebuah thread diskusi di forum Hugging Face meminta pengguna mengenai model AI gratis atau open-source apa yang mereka gunakan saat ini untuk pengembangan chatbot dan alasan preferensi mereka.
Seorang pengguna di forum Hugging Face mencari rekomendasi untuk model AI tanpa sensor yang mampu bernalar tentang topik kompleks, dengan menyebutkan preferensi terhadap versi awal GPT-4 dibandingkan iterasi saat ini.
Proyek llama.cpp telah merilis versi b9846, yang mencakup optimasi backend Vulkan untuk Asahi Linux. Pembaruan ini mengembalikan loop ukuran blok dalam perkalian matriks untuk meningkatkan kompatibilitas dan kinerja pada perangkat keras Apple Silicon yang menjalankan Linux.