Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 19

Pembaruan SimpleLLMChat 1.2.5 untuk AI Agentic di Windows XP

Pengembang telah merilis versi 1.2.5 dari SimpleLLMChat, sebuah harness AI agentic yang dirancang untuk dijalankan pada mesin lama menggunakan Windows XP dan .NET 4.0.

media r/LocalLLaMA · 7 jam lalu

Apa yang ada di RAG Anda?

Seorang pengguna Reddit mempertanyakan utilitas praktis dari Retrieval-Augmented Generation (RAG) untuk proyek pribadi yang melibatkan pemrograman, pekerjaan sysadmin, dan basis kode kecil. Penulis berargumen bahwa pengetahuan industri standar sudah tercakup dengan baik oleh model, sementara sumber data spesifik seperti basis kode atau referensi API terlalu kecil sehingga tidak memerlukan pengindeksan atau terlalu besar untuk dikelola secara efisien.

media r/LocalLLaMA · 7 jam lalu

CEO Palantir marah besar terhadap model tertutup

CEO Palantir, Alex Karp, secara publik mengkritik Anthropic dan OpenAI karena diduga membebankan biaya berlebihan kepada pelanggan dan menyalahgunakan data mereka. Sikap ini muncul saat Palantir baru-bar ini mengamankan kesepakatan untuk membeli chip Nvidia guna menjalankan model lokal bagi klien perusahaan mereka.

media r/LocalLLaMA · 7 jam lalu

Trik murah untuk output terstruktur yang andal: umpankan kembali kesalahan validasi ke dalam percobaan ulang

Untuk meningkatkan keandalan saat menghasilkan output terstruktur dari model bahasa besar, sebuah metode diusulkan yang mengembalikan kesalahan validasi dan output sebelumnya dari model ke dalam prompt selama percobaan ulang. Pendekatan ini mengubah proses dari pengacakan respons acak menjadi koreksi diri atas kesalahan spesifik dengan mengedit upaya sebelumnya.

media Hugging Face Forums · 12 jam lalu

Ketidaksesuaian Antara Slot ZeroGPU yang Dilaporkan dan Spaces yang Terdaftar

Seorang pengguna mengalami kesalahan kuota yang menyatakan bahwa 17 slot ZeroGPU sedang digunakan terhadap batas 10, meskipun hanya mendaftarkan 8 Spaces yang meminta perangkat keras zero-a10g.

media Hugging Face Forums · 12 jam lalu

Pengguna mengalami SecretsInjectionError saat mendeploy SAM3 di Azure

Seorang pengguna melaporkan mengalami SecretsInjectionError saat mencoba mendeploy model Meta SAM3 di Microsoft Azure menggunakan contoh Hugging Face Foundry. Kesalahan ini terjadi selama fase pengaturan dan instalasi saat memanggil API yang telah dideploy.

media Hugging Face Forums · 12 jam lalu

NanoI2V: Membangun Model Image-to-Video dari Awal

NanoI2V adalah proyek open-source yang mengimplementasikan model generasi Image-to-Video dari awal, dengan tujuan memberikan referensi yang bersih dan edukatif untuk teknik generasi video modern. Repositori ini mengutamakan keterbacaan dan reproduktibilitas dibandingkan kompleksitas yang ditemukan di sebagian besar proyek state-of-the-art.

media Hugging Face Forums · 12 jam lalu

Bagaimana cara mempublikasikan penelitian saya di HuggingFace?

Seorang pengguna di forum Hugging Face mencari panduan tentang cara mempublikasikan proyek penelitiannya, TIS (Token Importance Scoring), beserta kode dan dokumentasi terkait.

github Goose (Block) · 12 jam lalu

Catatan Rilis Goose v1.40.0

Pembaruan Goose v1.40.0 memperkenalkan dukungan lokalisasi ekstensif untuk aplikasi desktop, menambahkan locale untuk bahasa Prancis, Jerman, Italia, Portugis, Indonesia, Melayu, Vietnam, Tionghoa Tradisional, Korea, Jepang, Spanyol, dan Hindi.

media Hugging Face Forums · 15 jam lalu

Context Gravity

Chris Diaz telah membagikan proyek baru bernama Context Gravity, yang saat ini tersedia di GitHub. Penulis sedang mencari umpan balik komunitas mengenai repositori tersebut.

media Hugging Face Forums · 17 jam lalu

Show HF: ServBay, Runtime & Gerbang AI Lokal-Pertama untuk Agen Pemrograman

ServBay diperkenalkan sebagai solusi runtime dan infrastruktur lokal-pertama yang dirancang untuk menjembatani kesenjangan antara agen pemrograman AI dan mesin host pengguna. Ini mengatasi masalah "mil terakhir" di mana agen cerdas kekurangan kemampuan tingkat sistem untuk mengonfigurasi basis data, domain, atau sertifikat SSL tanpa intervensi manual pengembang.

media Hugging Face Forums · 17 jam lalu

Prism Transformer: Jadwal Kepala Progresif untuk Pemrosesan Perhatian Hierarkis

Prism Transformer memperkenalkan jadwal kepala progresif yang bervariasi jumlah kepala perhatian di seluruh lapisan, dimulai dengan lebih sedikit kepala lebar di lapisan awal dan meningkat secara monoton seiring kedalaman. Pendekatan ini menantang alokasi seragam standar dengan memenuhi kebutuhan struktural yang berbeda antara lapisan awal dan akhir tanpa menambah overhead arsitektur.

github CrewAI · 17 jam lalu

Catatan Rilis LangChain v1.15.2a2

Rilis ini memperbarui LangChain dengan fitur baru untuk integrasi Bedrock, dokumentasi agen aliran, dan navigasi streaming, bersama dengan perbaikan bug dan peningkatan dokumentasi.

media Hugging Face Forums · 18 jam lalu

Fractal Dreaming + Perencanaan Terinspirasi Kuantum: Alat Penemuan Pengetahuan yang Berorganisasi Sendiri dengan DeepSeek Coder

Penulis menyajikan alat penemuan pengetahuan yang berorganisasi sendiri yang mengintegrasikan generasi pola fraktal dan superposisi terinspirasi kuantum untuk meningkatkan eksplorasi ruang pengetahuan oleh DeepSeek Coder. Sistem ini mengoptimalkan lintasan pencarian dengan menyimpan jalur kreatif yang berhasil sebagai kueri yang di-cache, bukan memori, menyesuaikan penggunaan sumber daya berdasarkan kendala perangkat keras.

media Hugging Face Forums · 18 jam lalu

Wmf - teknik eksperimental baru

Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.

media Hugging Face Forums · 18 jam lalu

LLM Lokal di MacBook M5 Pro - Sama Sekali Baru Dalam Ini!

Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.

media Together AI Blog · 19 jam lalu

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

lab Hugging Face Blog · 20 jam lalu

Hugging Face dan Cerebras menghadirkan Gemma 4 ke AI suara real-time

Hugging Face dan Cerebras telah mengintegrasikan model Gemma 4 dari Google ke dalam platform mereka untuk memungkinkan aplikasi kecerdasan buatan suara real-time. Kolaborasi ini memungkinkan pengembang memanfaatkan kemampuan multimodal Gemma 4 untuk tugas pemrosesan audio dengan latensi rendah.

media Together AI Blog · 20 jam lalu

Mengumumkan pendanaan Seri C senilai $800M untuk mempercepat peralihan ke AI open-source

Perusahaan telah mengumpulkan $800 juta dalam putaran pendanaan Seri C yang bertujuan untuk mempercepat transisi menuju kecerdasan buatan open-source.

lab Hugging Face Blog · 20 jam lalu

ScarfBench: Benchmarking Agen AI untuk Migrasi Framework Java Enterprise

Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.