Wmf - teknik eksperimental baru
Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.
Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.
Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.
Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.
Hugging Face dan Cerebras telah mengintegrasikan model Gemma 4 dari Google ke dalam platform mereka untuk memungkinkan aplikasi kecerdasan buatan suara real-time. Kolaborasi ini memungkinkan pengembang memanfaatkan kemampuan multimodal Gemma 4 untuk tugas pemrosesan audio dengan latensi rendah.
Perusahaan telah mengumpulkan $800 juta dalam putaran pendanaan Seri C yang bertujuan untuk mempercepat transisi menuju kecerdasan buatan open-source.
Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.
Rilis crewAI 1.15.2a1 memperkenalkan beberapa fitur baru, perbaikan bug, dan pembaruan dokumentasi untuk kerangka kerja orkestrasi agen.
Proyek llama.cpp telah merilis versi b9858, yang mencakup perubahan untuk menggunakan split utama Hugging Face sebagai jalur model. Pembaruan ini menyelesaikan isu #25181 mengenai jalur pemuatan model.
Rilis llama.cpp b9857 memperkenalkan penataan ulang menyeluruh pada implementasi Hexagon Flash Attention, dengan fokus pada optimasi dan peningkatan akurasi. Pembaruan ini mencakup perubahan signifikan pada modul hex-mm dan hex-fa, seperti penggabungan tugas kuantisasi ke dalam utas matmul utama, fusi dengan operasi ADD, dan optimasi pemrosesan mask.
Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.
Proyek llama.cpp telah merilis versi b9856, memperkenalkan penggunaan konsisten dari kata kunci `restrict` dan PDL untuk Flash Attention di CUDA. Pembaruan ini disertai dengan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.
Pembaruan ini menghapus mekanisme fallback navigasi Progressive Web App (PWA). Perubahan ini diterapkan secara khusus untuk mencegah pengodean yang tidak disengaja dari permintaan titik akhir API.
Proyek llama.cpp telah merilis versi b9852, memperkenalkan dukungan awal OpenCL untuk format kuantisasi q1_0. Pembaruan ini mencakup kemampuan q1_0 umum dan implementasi GEMM/GEMV Adreno spesifik untuk perangkat OpenCL.
Anthropic memulihkan akses global ke model Claude Fable 5 dan Mythos 5 setelah pemerintah AS mencabut kontrol ekspor yang telah menangguhkan ketersediaan untuk semua pengguna. Fable 5 akan tersedia secara global mulai 1 Juli di Platform Claude, dengan batas penggunaan berlaku hingga 7 Juli sebelum beralih ke akses berbasis kredit.
Proyek llama.cpp telah merilis versi b9851, yang mencakup perbaikan untuk CUDA guna mencegah kesalahan pemotongan integer dan overflow pada kernel flash_attn_mask_to_KV_max. Pembaruan ini mengatasi masalah terkait langkah-langkah mask KQ dalam kernel yang ditentukan.
Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.
SDK Python Model Context Protocol (MCP) telah merilis versi beta pertamanya, v2.0.0b1, yang memperkenalkan dukungan penuh untuk spesifikasi MCP 2026-07-28. Pra-rilis ini hanya dapat diaktifkan secara opsional, memastikan bahwa instalasi standar tetap mengarah ke jalur stabil 1.x.
Microsoft Research memperkenalkan SkillOpt, sebuah metode yang memperlakukan file keterampilan agen sebagai parameter yang dapat dilatih di luar model target beku, mengubah pengeditan keterampilan manual menjadi proses optimasi terkontrol. Pendekatan ini meningkatkan keandalan dan konsistensi agen tanpa memperbarui bobot model dasar.
Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.
Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.