Rilis llama.cpp b9847 memperbaiki Gemma E4B MTP FlashAttention
Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.
Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.
Penulis memperkenalkan Trajlens, sebuah linter open-source untuk kategori LeRobotDataset di Hugging Face Hub, dan melaporkan hasil dari audit terhadap 100 dataset publik acak yang ditandai dengan 'lerobot'. Audit mengungkapkan bahwa hanya 19 dataset yang lulus validasi, sementara 13 gagal karena bug hulu spesifik dan 47 mengalami kesalahan pemuatan atau timeout.
Sebuah permintaan fitur mengusulkan Jaringan Adversarial Epistemologis (EAN), sebuah arsitektur yang dirancang untuk mengubah AI dari sistem yang mencerminkan konsensus institusional menjadi mesin verifikasi terdesentralisasi dan multi-perspektif. Pendekatan ini bertujuan menghilangkan permainan kekuasaan politik dan korporat dengan menghapus model "sumber kebenaran" tunggal.
Sebuah thread diskusi di forum Hugging Face meminta pengguna mengenai model AI gratis atau open-source apa yang mereka gunakan saat ini untuk pengembangan chatbot dan alasan preferensi mereka.
Seorang pengguna di forum Hugging Face mencari rekomendasi untuk model AI tanpa sensor yang mampu bernalar tentang topik kompleks, dengan menyebutkan preferensi terhadap versi awal GPT-4 dibandingkan iterasi saat ini.
Proyek llama.cpp telah merilis versi b9846, yang mencakup optimasi backend Vulkan untuk Asahi Linux. Pembaruan ini mengembalikan loop ukuran blok dalam perkalian matriks untuk meningkatkan kompatibilitas dan kinerja pada perangkat keras Apple Silicon yang menjalankan Linux.
Proyek llama.cpp telah merilis versi b9844, yang memperkenalkan dukungan ggml-webgpu untuk format kuantisasi NVFP4. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.
Alat audit AgentSeal v5 mengevaluasi ketersediaan publik artefak dalam benchmark SWE-bench Pro untuk menilai risiko kontaminasi potensial. Studi ini menemukan bahwa meskipun 12 instances menunjukkan tumpang tindih konten deterministik dan 76 repositori adalah anggota korpus yang mungkin, sebagian besar bukti terdiri dari replikasi publik dengan tanggal tidak diketahui daripada kontaminasi pra-cutoff yang terbukti.
Google UK telah merilis Laporan Dampak Ekonominya yang terbaru, yang merinci strategi untuk membantu lebih banyak orang memanfaatkan manfaat teknologi berbasis AI di negara tersebut.
Proyek llama.cpp telah menerbitkan rilis b9843, menyediakan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur perangkat keras.
Versi LangGraph 1.2.7 telah dirilis, memperkenalkan perbaikan bug dan pembaruan dependensi untuk ekosistem LangChain.
Sebuah panduan open-source, bilingual dalam bahasa Inggris dan Spanyol yang merinci cara kerja internal Transformer telah dipublikasikan. Sumber daya ini mencakup matematika dan mekanika tepat di balik collapse perhatian dan kompresi KV-cache.
Proyek penelitian independen LIMEN menganalisis dinamika internal dari tujuh model Transformer sumber terbuka, mengungkapkan bahwa ambiguitas semantik mengubah geometri lintasan dan mengungkap tata bahasa dinamis universal di seluruh arsitektur.
Microsoft Research memperkenalkan Memora, sebuah kerangka kerja memori agentic yang skalabel untuk menyeimbangkan abstraksi dan spesifisitas pada tugas AI jangka panjang. Sistem ini memisahkan konten memori yang kaya dari struktur pengambilan yang ringan, menghasilkan hasil state-of-the-art baru pada benchmark sambil menggunakan hingga 98% lebih sedikit token konteks.
Claude Code versi 2.1.196 memperkenalkan model default organisasi, lampiran file yang dapat diklik, dan peningkatan keamanan untuk persetujuan server MCP. Pembaruan ini juga meningkatkan keandalan sesi latar belakang, memperbaiki berbagai masalah pelaporan status agen, serta mengoptimalkan penggunaan token dalam alur kerja tinjauan kode.
Artikel ini memperkenalkan DiScoFormer, sebuah model transformator terpadu yang mampu melakukan estimasi densitas dan tugas generasi berbasis skor di berbagai distribusi data.
Proyek UCTF telah direstrukturisasi dari satu proposal menjadi program riset terbuka yang digerakkan oleh hipotesis untuk menyelidiki apakah representasi perantara asli-mesin dapat mengurangi redundansi semantik lintas-bahasa dalam pelatihan AI multibahasa.
Seorang pengguna melaporkan mengalami kesalahan saat mencoba menghasilkan sertifikat penyelesaian untuk kursus Deep RL di Hugging Face. Masalah ini tetap terjadi meskipun telah memasukkan detail nama pengguna dan nama yang diperlukan, tanpa panduan yang ada tersedia secara online.
Seorang ahli Google menjelaskan konsep pendekatan full-stack dalam kecerdasan buatan. Artikel ini menyoroti bahwa metodologi komprehensif ini telah menjadi dasar bagi pekerjaan AI Google selama periode yang panjang.
Rilis llama.cpp b9842 memperkenalkan perubahan untuk mendeduplikasi entri preset dan model ter-cache pada endpoint /v1/models. Pembaruan ini disetujui oleh Adrien Gallouët dari Hugging Face.