Semua artikel
media r/LocalLLaMA · 7 jam lalu

Apa yang ada di RAG Anda?

Seorang pengguna Reddit mempertanyakan utilitas praktis dari Retrieval-Augmented Generation (RAG) untuk proyek pribadi yang melibatkan pemrograman, pekerjaan sysadmin, dan basis kode kecil. Penulis berargumen bahwa pengetahuan industri standar sudah tercakup dengan baik oleh model, sementara sumber data spesifik seperti basis kode atau referensi API terlalu kecil sehingga tidak memerlukan pengindeksan atau terlalu besar untuk dikelola secara efisien.

media r/LocalLLaMA · 7 jam lalu

Trik murah untuk output terstruktur yang andal: umpankan kembali kesalahan validasi ke dalam percobaan ulang

Untuk meningkatkan keandalan saat menghasilkan output terstruktur dari model bahasa besar, sebuah metode diusulkan yang mengembalikan kesalahan validasi dan output sebelumnya dari model ke dalam prompt selama percobaan ulang. Pendekatan ini mengubah proses dari pengacakan respons acak menjadi koreksi diri atas kesalahan spesifik dengan mengedit upaya sebelumnya.

media Hugging Face Forums · 17 jam lalu

Prism Transformer: Jadwal Kepala Progresif untuk Pemrosesan Perhatian Hierarkis

Prism Transformer memperkenalkan jadwal kepala progresif yang bervariasi jumlah kepala perhatian di seluruh lapisan, dimulai dengan lebih sedikit kepala lebar di lapisan awal dan meningkat secara monoton seiring kedalaman. Pendekatan ini menantang alokasi seragam standar dengan memenuhi kebutuhan struktural yang berbeda antara lapisan awal dan akhir tanpa menambah overhead arsitektur.

media Hugging Face Forums · 18 jam lalu

Fractal Dreaming + Perencanaan Terinspirasi Kuantum: Alat Penemuan Pengetahuan yang Berorganisasi Sendiri dengan DeepSeek Coder

Penulis menyajikan alat penemuan pengetahuan yang berorganisasi sendiri yang mengintegrasikan generasi pola fraktal dan superposisi terinspirasi kuantum untuk meningkatkan eksplorasi ruang pengetahuan oleh DeepSeek Coder. Sistem ini mengoptimalkan lintasan pencarian dengan menyimpan jalur kreatif yang berhasil sebagai kueri yang di-cache, bukan memori, menyesuaikan penggunaan sumber daya berdasarkan kendala perangkat keras.