Semua artikel — korshunov.ai

Semua artikel Halaman 3 / 15

Rilis llama.cpp b9847 memperbaiki Gemma E4B MTP FlashAttention

Proyek llama.cpp telah merilis versi b9847, yang mencakup perbaikan untuk Gemma E4B MTP FlashAttention pada CUDA dan penghapusan deklarasi template yang tidak digunakan.

media Hugging Face Forums · 2 hari lalu

Trajlens: validator untuk LeRobotDataset, 100 dataset Hub diaudit

Penulis memperkenalkan Trajlens, sebuah linter open-source untuk kategori LeRobotDataset di Hugging Face Hub, dan melaporkan hasil dari audit terhadap 100 dataset publik acak yang ditandai dengan 'lerobot'. Audit mengungkapkan bahwa hanya 19 dataset yang lulus validasi, sementara 13 gagal karena bug hulu spesifik dan 47 mengalami kesalahan pemuatan atau timeout.

media Hugging Face Forums · 2 hari lalu

Proposal Arsitektur: Jaringan Adversarial Epistemologis (EAN) untuk AI Sumber Terbuka

Sebuah permintaan fitur mengusulkan Jaringan Adversarial Epistemologis (EAN), sebuah arsitektur yang dirancang untuk mengubah AI dari sistem yang mencerminkan konsensus institusional menjadi mesin verifikasi terdesentralisasi dan multi-perspektif. Pendekatan ini bertujuan menghilangkan permainan kekuasaan politik dan korporat dengan menghapus model "sumber kebenaran" tunggal.

media Hugging Face Forums · 2 hari lalu

Diskusi Komunitas tentang LLM Open-Source untuk Pengembangan Chatbot

Sebuah thread diskusi di forum Hugging Face meminta pengguna mengenai model AI gratis atau open-source apa yang mereka gunakan saat ini untuk pengembangan chatbot dan alasan preferensi mereka.

media Hugging Face Forums · 2 hari lalu

5 model terbaik yang bisa saya jalankan dengan perangkat keras saya? Tanpa lobotomisasi AI

Seorang pengguna di forum Hugging Face mencari rekomendasi untuk model AI tanpa sensor yang mampu bernalar tentang topik kompleks, dengan menyebutkan preferensi terhadap versi awal GPT-4 dibandingkan iterasi saat ini.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9846 dengan optimasi matmul Vulkan untuk Asahi Linux

Proyek llama.cpp telah merilis versi b9846, yang mencakup optimasi backend Vulkan untuk Asahi Linux. Pembaruan ini mengembalikan loop ukuran blok dalam perkalian matriks untuk meningkatkan kompatibilitas dan kinerja pada perangkat keras Apple Silicon yang menjalankan Linux.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9844 menambahkan dukungan NVFP4 dan biner baru

Proyek llama.cpp telah merilis versi b9844, yang memperkenalkan dukungan ggml-webgpu untuk format kuantisasi NVFP4. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

media Hugging Face Forums · 2 hari lalu

AgentSeal: Audit Ketersediaan Korpus untuk SWE-bench Pro

Alat audit AgentSeal v5 mengevaluasi ketersediaan publik artefak dalam benchmark SWE-bench Pro untuk menilai risiko kontaminasi potensial. Studi ini menemukan bahwa meskipun 12 instances menunjukkan tumpang tindih konten deterministik dan 76 repositori adalah anggota korpus yang mungkin, sebagian besar bukti terdiri dari replikasi publik dengan tanggal tidak diketahui daripada kontaminasi pra-cutoff yang terbukti.

lab Google — The Keyword (AI) · 2 hari lalu

Membuka era produktivitas berikutnya di Inggris: Membangun bangsa pelopor AI

Google UK telah merilis Laporan Dampak Ekonominya yang terbaru, yang merinci strategi untuk membantu lebih banyak orang memanfaatkan manfaat teknologi berbasis AI di negara tersebut.

github llama.cpp · 2 hari lalu

Rilis b9843 llama.cpp dengan biner untuk macOS, Linux, Windows

Proyek llama.cpp telah menerbitkan rilis b9843, menyediakan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur perangkat keras.

github LangGraph · 2 hari lalu

Catatan Rilis LangGraph 1.2.7

Versi LangGraph 1.2.7 telah dirilis, memperkenalkan perbaikan bug dan pembaruan dependensi untuk ekosistem LangChain.

media Hugging Face Forums · 2 hari lalu

Panduan Bilingual Open-Source tentang Mekanika Transformer Dipublikasikan

Sebuah panduan open-source, bilingual dalam bahasa Inggris dan Spanyol yang merinci cara kerja internal Transformer telah dipublikasikan. Sumber daya ini mencakup matematika dan mekanika tepat di balik collapse perhatian dan kompresi KV-cache.

media Hugging Face Forums · 2 hari lalu

[Penelitian] Dari Geometri Fungsional ke Tata Bahasa Dinamis: Audit LIMEN Baru (V23–V24) di 7 Arsitektur

Proyek penelitian independen LIMEN menganalisis dinamika internal dari tujuh model Transformer sumber terbuka, mengungkapkan bahwa ambiguitas semantik mengubah geometri lintasan dan mengungkap tata bahasa dinamis universal di seluruh arsitektur.

lab Microsoft Research Blog · 2 hari lalu

Memora: Representasi Memori Harmonik yang Menyeimbangkan Abstraksi dan Spesifisitas

Microsoft Research memperkenalkan Memora, sebuah kerangka kerja memori agentic yang skalabel untuk menyeimbangkan abstraksi dan spesifisitas pada tugas AI jangka panjang. Sistem ini memisahkan konten memori yang kaya dari struktur pengambilan yang ringan, menghasilkan hasil state-of-the-art baru pada benchmark sambil menggunakan hingga 98% lebih sedikit token konteks.

lab Claude Code Releases · 2 hari lalu

Catatan Rilis Claude Code v2.1.196

Claude Code versi 2.1.196 memperkenalkan model default organisasi, lampiran file yang dapat diklik, dan peningkatan keamanan untuk persetujuan server MCP. Pembaruan ini juga meningkatkan keandalan sesi latar belakang, memperbaiki berbagai masalah pelaporan status agen, serta mengoptimalkan penggunaan token dalam alur kerja tinjauan kode.

lab Hugging Face Blog · 3 hari lalu

DiScoFormer: Satu transformer untuk densitas dan skor, melintasi distribusi

Artikel ini memperkenalkan DiScoFormer, sebuah model transformator terpadu yang mampu melakukan estimasi densitas dan tugas generasi berbasis skor di berbagai distribusi data.

media Hugging Face Forums · 3 hari lalu

Proyek UCTF: Program Riset Terbuka tentang Representasi Pelatihan AI Asli-Mesin

Proyek UCTF telah direstrukturisasi dari satu proposal menjadi program riset terbuka yang digerakkan oleh hipotesis untuk menyelidiki apakah representasi perantara asli-mesin dapat mengurangi redundansi semantik lintas-bahasa dalam pelatihan AI multibahasa.

media Hugging Face Forums · 3 hari lalu

Kesalahan Menghasilkan Sertifikat Kursus Deep RL

Seorang pengguna melaporkan mengalami kesalahan saat mencoba menghasilkan sertifikat penyelesaian untuk kursus Deep RL di Hugging Face. Masalah ini tetap terjadi meskipun telah memasukkan detail nama pengguna dan nama yang diperlukan, tanpa panduan yang ada tersedia secara online.

lab Google — The Keyword (AI) · 3 hari lalu

Tanyakan pada ahli AI: Apa sebenarnya full stack?

Seorang ahli Google menjelaskan konsep pendekatan full-stack dalam kecerdasan buatan. Artikel ini menyoroti bahwa metodologi komprehensif ini telah menjadi dasar bagi pekerjaan AI Google selama periode yang panjang.

github llama.cpp · 3 hari lalu

Rilis llama.cpp b9842: deduplisisi preset dan entri model ter-cache di /v1/models

Rilis llama.cpp b9842 memperkenalkan perubahan untuk mendeduplikasi entri preset dan model ter-cache pada endpoint /v1/models. Pembaruan ini disetujui oleh Adrien Gallouët dari Hugging Face.