Wmf - teknik eksperimental baru
Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.
Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.
Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.
Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.
Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.
Rilis crewAI 1.15.2a1 memperkenalkan beberapa fitur baru, perbaikan bug, dan pembaruan dokumentasi untuk kerangka kerja orkestrasi agen.
Rilis llama.cpp b9857 memperkenalkan penataan ulang menyeluruh pada implementasi Hexagon Flash Attention, dengan fokus pada optimasi dan peningkatan akurasi. Pembaruan ini mencakup perubahan signifikan pada modul hex-mm dan hex-fa, seperti penggabungan tugas kuantisasi ke dalam utas matmul utama, fusi dengan operasi ADD, dan optimasi pemrosesan mask.
Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.
Proyek llama.cpp telah merilis versi b9856, memperkenalkan penggunaan konsisten dari kata kunci `restrict` dan PDL untuk Flash Attention di CUDA. Pembaruan ini disertai dengan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.
Pembaruan ini menghapus mekanisme fallback navigasi Progressive Web App (PWA). Perubahan ini diterapkan secara khusus untuk mencegah pengodean yang tidak disengaja dari permintaan titik akhir API.
Proyek llama.cpp telah merilis versi b9852, memperkenalkan dukungan awal OpenCL untuk format kuantisasi q1_0. Pembaruan ini mencakup kemampuan q1_0 umum dan implementasi GEMM/GEMV Adreno spesifik untuk perangkat OpenCL.
Anthropic memulihkan akses global ke model Claude Fable 5 dan Mythos 5 setelah pemerintah AS mencabut kontrol ekspor yang telah menangguhkan ketersediaan untuk semua pengguna. Fable 5 akan tersedia secara global mulai 1 Juli di Platform Claude, dengan batas penggunaan berlaku hingga 7 Juli sebelum beralih ke akses berbasis kredit.
Proyek llama.cpp telah merilis versi b9851, yang mencakup perbaikan untuk CUDA guna mencegah kesalahan pemotongan integer dan overflow pada kernel flash_attn_mask_to_KV_max. Pembaruan ini mengatasi masalah terkait langkah-langkah mask KQ dalam kernel yang ditentukan.
Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.
SDK Python Model Context Protocol (MCP) telah merilis versi beta pertamanya, v2.0.0b1, yang memperkenalkan dukungan penuh untuk spesifikasi MCP 2026-07-28. Pra-rilis ini hanya dapat diaktifkan secara opsional, memastikan bahwa instalasi standar tetap mengarah ke jalur stabil 1.x.
Microsoft Research memperkenalkan SkillOpt, sebuah metode yang memperlakukan file keterampilan agen sebagai parameter yang dapat dilatih di luar model target beku, mengubah pengeditan keterampilan manual menjadi proses optimasi terkontrol. Pendekatan ini meningkatkan keandalan dan konsistensi agen tanpa memperbarui bobot model dasar.
Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.
Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.
Anthropic telah merilis versi 2.1.197 dari Claude Code, yang memperbarui model default menjadi Claude Sonnet 5. Model baru ini memiliki jendela konteks native 1M-token dan tersedia dengan harga promosi hingga 31 Agustus.
GeneBench-Pro adalah benchmark yang dirancang untuk mengevaluasi model pada tugas penalaran genomik kompleks, menampilkan sepuluh studi kasus terperinci yang menunjukkan pertanyaan representatif dan materi pendukung. Setiap studi kasus menyediakan prompt asli, dataset, dan konteks yang diperlukan untuk menilai kinerja model pada tantangan biologis spesifik.
GeneBench-Pro adalah benchmark tingkat penelitian yang dirancang untuk mengukur bagaimana agen AI menangani ambiguitas dan membuat penilaian konsekuensial dalam biologi komputasi, dengan memperluas dari GeneBench asli. Ini mengatasi keterbatasan evaluasi saat ini dengan menguji kemampuan tingkat tinggi seperti menangani noise data, merevisi asumsi, dan menentukan kapan hasil siap untuk pengambilan keputusan.