Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 19

media Hugging Face Forums · 10 hari lalu

Kemampuan Tidak Ada di Bobot: Hasil Empiris Negatif pada Proyeksi Bobot MLP

Sebuah studi empiris menemukan bahwa memproyeksikan bobot MLP dari satu model transformer ke model lain gagal mentransfer kemampuan semantik. Setiap varian yang diuji menunjukkan kinerja lebih buruk daripada model host yang tidak dimodifikasi, mengindikasikan keterbatasan struktural dalam proyeksi bobot. Hasil ini menantang klaim publik mengenai kemampuan model berdasarkan benchmark, menunjukkan bahwa klaim tersebut tidak mencerminkan geometri bobot internal yang sebenarnya.

media Hugging Face Forums · 10 hari lalu

The Clockwork Dark: Mesin Naratif-RPG AI-Lokal Pertama

The Clockwork Dark adalah mesin naratif-RPG yang memprioritaskan penggunaan lokal dan didorong oleh AI, menggunakan mesin keadaan deterministik untuk menyelesaikan semua mekanik permainan. Mesin ini menampilkan dua LLM otonom yang menceritakan kisah, dengan satu berperan sebagai suara dunia yang sabar dan lainnya sebagai asisten bergaya dewa yang tidak dapat diandalkan. Permainan ini menawarkan pemain pilihan: melawan korupsi supranatural yang mengancam atau menjalani kehidupan tenang di sebuah toko roti, dengan kedua jalur tersebut dianggap sebagai akhir cerita yang valid.

media Hugging Face Forums · 10 hari lalu

Terjebak terus-menerus pada 'starting' dengan kontainer Docker yang sedang berjalan

Seorang pengguna melaporkan bahwa kontainer Dockernya dengan R/Shiny di rocker/r2u berhasil dibangun dan menampilkan 'Listening on http://0.0.0.0:7860' dalam log, namun ruangannya tetap berada dalam status 'starting' dan tidak dapat diakses. Masalah ini berlanjut meskipun tidak ada kesalahan kode, dan pengguna tersebut mencari perhatian lebih luas, mencatat bahwa hal itu mungkin merupakan masalah sisi platform dengan Hugging Face.

media Hugging Face Forums · 10 hari lalu

NOVA-VAD mengalahkan Silero, Pyannote, dan WebRTC pada audio berisik dengan akurasi 93%

NOVA-VAD, Detektor Aktivitas Suara yang ringan dan dapat dijelaskan, mencapai akurasi 93% pada audio berisik dari dataset UrbanSound8K, mengungguli WebRTC (58%), Pyannote (62%), dan Silero (87%). Ia hanya menggunakan scikit-learn, tidak memerlukan GPU, dan memberikan pentingnya fitur serta skor kepercayaan dalam bahasa Inggris sederhana.

media Hugging Face Forums · 10 hari lalu

Perbandingan debug skala kecil OLMo-core dengan graft Engram

Perbandingan pelatihan 200 langkah antara model dasar OLMo3 600M dan versi dengan graft Engram gaya DeepSeek menunjukkan loss pelatihan dan evaluasi yang lebih rendah, stabilisasi grad-norm yang lebih cepat, dan perilaku pembelajaran awal yang lebih baik. Graft Engram, disuntikkan ke lapisan 1 dan 5, meningkatkan parameter yang dapat dilatih menjadi ~1,7B tetapi hanya mempertahankan peningkatan 40k pada parameter aktif per token, menunjukkan penggunaan memori yang efisien.

media Hugging Face Forums · 10 hari lalu

LLM sebagai Akselerator Epistemik: Risikonya Bukan Hanya Halusinasi

LLM tidak hanya berhalusinasi; mereka memperkuat overconfidence epistemik manusia dengan mengubah hipotesis lemah menjadi klaim yang koheren dan rapi sebelum bukti diverifikasi. Ini menciptakan risiko kepastian prematur dalam penelitian, kebijakan, dan domain lainnya, bukan karena model berbohong, tetapi karena mereka mempercepat kecenderungan manusia untuk lebih menyukai penjelasan yang elegan daripada ketidakpastian.

media Hugging Face Forums · 10 hari lalu

Kart Akselerator AI Tenstorrent Tersedia

Tenstorrent telah merilis kartu akselerator AI Wormhole dan Blackhole. Bagian perangkat keras mencantumkan kartu-kartu ini, dengan diskusi mengenai model mana yang kemungkinan kompatibel.

media Hugging Face Forums · 10 hari lalu

Space terjebak 'Restarting' pada commit lama selama lebih dari 16 jam

Sebuah Hugging Face Space terjebak menampilkan 'Restarting' pada commit 8240352 selama lebih dari 16 jam, meskipun beberapa commit yang lebih baru berhasil dibangun. Container mulai dengan sehat di log, tetapi lalu lintas tidak pernah beralih ke versi baru, dan tindakan pemulihan seperti rebuild pabrik atau restart tidak memberikan efek apa pun.

github llama.cpp · 10 hari lalu

llama.cpp Rilis b9751: Binari Baru dan Perbaikan

llama.cpp merilis versi b9751 dengan binari yang diperbarui untuk macOS, Linux, Android, Windows, dan openEuler. Rilis ini mencakup perbaikan penggunaan memori dan mendukung berbagai arsitektur serta opsi akselerasi perangkat keras seperti Vulkan, CUDA, OpenVINO, dan SYCL.

github llama.cpp · 10 hari lalu

llama.cpp merilis b9752: refaktor server dan binari lintas-platform

llama.cpp merilis versi b9752 dengan refaktor server yang berfokus pada konstruksi batch, termasuk penanganan kasus batch penuh yang lebih baik dan perbaikan bug. Rilis ini mencakup binari pra-bangun untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan kerangka akselerasi seperti CUDA, Vulkan, OpenVINO, dan SYCL.

github llama.cpp · 10 hari lalu

llama.cpp Rilis b9753: Binari Baru dan Pelaporan Kemajuan

llama.cpp versi b9753 memperkenalkan pelaporan kemajuan yang lebih baik untuk memuat model spesifikasi, termasuk daftar "tahap" baru. Rilis ini mencakup binari untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, seperti Vulkan, CUDA, OpenVINO, dan SYCL.

github llama.cpp · 10 hari lalu

llama.cpp merilis b9754: parser AC baru dan binari lintas platform

llama.cpp versi b9754 memperkenalkan parser AC untuk generasi tata bahasa yang lebih ketat di modul common/peg. Rilis ini mencakup binari pra-kompilasi untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan teknologi akselerasi seperti Vulkan, CUDA, OpenVINO, dan SYCL.

github llama.cpp · 10 hari lalu

Tambahkan dependensi libandroid-spawn untuk pembangunan Android

Dokumentasi pembangunan Android telah diperbarui untuk menyertakan dependensi pada libandroid-spawn. Penambahan ini dimaksudkan untuk mendukung proses pembangunan dalam lingkungan yang ditentukan.

lab OpenAI News · 10 hari lalu

Samsung Mengimplementasikan ChatGPT dan Codex untuk Karyawan

Samsung Electronics telah meluncurkan ChatGPT Enterprise dan Codex dari OpenAI ke tenaga kerjanya di seluruh dunia. Implementasi ini merupakan salah satu inisiatif AI perusahaan terbesar yang pernah dilakukan oleh OpenAI hingga saat ini.

github llama.cpp · 11 hari lalu

llama.cpp merilis b9750: pernyataan call baru dan binari lintas platform

Versi llama.cpp b9750 memperkenalkan implementasi pernyataan call dan membatalkan perubahan yang tidak disengaja. Rilis ini mencakup binari pra-dikompilasi untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur serta opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, OpenVINO, dan SYCL.

github llama.cpp · 11 hari lalu

llama.cpp merilis versi b9748 dengan biner dan fitur baru

llama.cpp merilis versi b9748, menambahkan bidang "verbose" ke skemanya dan menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler. Rilis ini mencakup dukungan CPU, Vulkan, OpenVINO, SYCL, dan ROCm di berbagai arsitektur, dengan build iOS dan Windows CUDA serta Vulkan tersedia.

media Hugging Face Forums · 11 hari lalu

Permintaan untuk menghapus paksa Space Hugging Face yang macet

Pengguna meminta penghapusan paksa Space Hugging Face "kayinda/rxsteward" yang macet dalam status "Building". Semua upaya penghapusan gagal dengan kesalahan 403 atau kesalahan input tidak valid 400, mencegah penggunaan ulang nama tersebut.

lab Hugging Face Blog · 11 hari lalu

Dapatkah Anda Mengalahkan LoRA dalam Fine-Tuning?

Sebuah studi baru mengeksplorasi alternatif untuk LoRA, teknik fine-tuning paling populer, menilai apakah metode lain dapat mencapai kinerja yang lebih baik dengan biaya komputasi yang lebih rendah. Penelitian menemukan bahwa meskipun beberapa pendekatan menunjukkan janji, tidak ada yang secara konsisten mengungguli LoRA di berbagai tugas dan dataset.

lab Google DeepMind Blog · 11 hari lalu

Peta Jalan Kontrol AI untuk Keamanan Sistem Internal

Sebuah Peta Jalan Kontrol AI telah diperkenalkan untuk mengamankan sistem internal dengan mengintegrasikan perlindungan tradisional dan kemampuan pemantauan waktu nyata.

lab OpenAI News · 11 hari lalu

GPT-5.5 Instant Meningkatkan Respons Kesehatan ChatGPT

GPT-5.5 Instant meningkatkan respons kesehatan dan kesejahteraan ChatGPT melalui penalaran yang lebih kuat, penanganan konteks yang lebih baik, komunikasi yang lebih jelas, serta evaluasi berdasarkan informasi dari dokter.