Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 21

blog Simon Willison · 1 jam lalu Langsung

Memahami agar dapat berpartisipasi

Geoffrey Litt berargumen bahwa pengembang harus memahami kode yang dihasilkan oleh agen coding secara mendalam untuk menghindari cognitive debt dan tetap menjadi peserta aktif dalam proses kreatif.

media r/LocalLLaMA · 1 jam lalu Langsung

OpenLumara kini menghubungkan UI apa pun ke model lokal melalui endpoint OpenAI

Kerangka kerja open source OpenLumara kini mendukung koneksi ke antarmuka pengguna apa pun yang dapat berkomunikasi dengan endpoint OpenAI, seperti KoboldLite dan OpenWebUI. Pembaruan ini memungkinkan pengguna untuk mengintegrasikan harness hemat token ke dalam alur kerja mereka yang ada tanpa mengubah frontend pilihan mereka.

media r/LocalLLaMA · 1 jam lalu Langsung

Apakah ada yang menggunakan LLM lokal untuk generasi spasial skala besar atau tata kota dalam perangkat lunak seperti QGIS?

Seorang pengguna mencari rekomendasi untuk model bahasa lokal yang mampu menghasilkan data struktural skala besar, seperti tata kota secara keseluruhan, jaringan jalan, dan sistem grid kompleks.

media r/LocalLLaMA · 3 jam lalu

Dual R9700: Rumus terbaik untuk Qwen3.6 27B?

Seorang pengguna menyelidiki pengoptimalan model Qwen3.6-27B pada setup dual AMD Radeon R9700 menggunakan llama.cpp, membandingkan kinerja antara backend Vulkan dan ROCm.

media r/LocalLLaMA · 3 jam lalu

Kernel WebGPU Gemma 4 Mencapai 255 tok/s

Xenova telah merilis kernel WebGPU untuk Gemma 4, mencapai kinerja 255 token per detik. Optimasi ini memungkinkan model padat berjalan dengan kecepatan melebihi 100 T/s di browser web.

blog Simon Willison · 4 jam lalu

Menggunakan DSPy untuk mengevaluasi dan meningkatkan prompt sistem SQL Agen Datasette

Simon Willison memanfaatkan Claude Code dengan model Fable 5 untuk mengotomatisasi evaluasi dan optimisasi prompt sistem untuk Agen Datasette, khususnya menargetkan fitur eksekusi kueri SQL hanya-baca. Proses ini melibatkan pemasangan alpha terbaru Datasette dan DSPy untuk mengidentifikasi kelemahan dalam cara agen menangani informasi skema.

media r/LocalLLaMA · 4 jam lalu

Perintis AI Nvidia tolak AGI, bandingkan OpenAI dan Anthropic dengan AOL

Seorang tokoh terkemuka dari Nvidia menyatakan bahwa ia tidak percaya pada Kecerdasan Umum Buatan (AGI) dan berargumen bahwa fokus industri harus beralih ke model open-source yang disesuaikan untuk bisnis.

media r/LocalLLaMA · 4 jam lalu

Benchmark lokal dengan RTX 3090 - Qwen3.6 27b vs Ornith

Seorang pengguna membandingkan Qwen3.6 27b, Gemma4 26B A4B QAT, dan Ornith1.0 35B MoE menggunakan kerangka kerja inspect-ai pada RTX 3090 untuk mengevaluasi kinerja model lokal. Pengujian mengungkapkan hasil yang beragam di berbagai benchmark pengetahuan umum, grounding, dan pemrograman, dengan Qwen3.6 umumnya memimpin dalam skor sementara Ornith menunjukkan kekuatan di area tertentu seperti DROP.

media r/LocalLLaMA · 7 jam lalu

Pengguna meminta model visi untuk mendeteksi api atau asap

Seorang pengguna Reddit mencari rekomendasi untuk model visi yang mampu mendeteksi api atau asap, khususnya dalam konteks memantau puing-puing yang membara selama musim kembang api 4 Juli.

media r/LocalLLaMA · 7 jam lalu

Analisis 2.3k Aplikasi AI Lokal Mengungkap 82 Kategori dan Berbagai Kasus Penggunaan

Sebuah analisis terhadap Mac App Store mengidentifikasi 2.259 aplikasi AI lokal dari lebih dari 20.000 entri yang di-scrape, menyoroti ekosistem alat niche yang berkembang yang membungkus model dengan alur kerja spesifik. Survei ini mencakup 82 kategori berbeda, mulai dari tugas umum seperti transkripsi dan OCR hingga fungsi khusus seperti styling pakaian dan bantuan kesehatan hewan peliharaan.

media r/LocalLLaMA · 8 jam lalu

Gemma-4-31B yang Ditala Halus untuk Skor Copywriting +290 Elo di EqBench3

Seorang pengguna telah merilis penalaan halus sempit dari model Gemma-4-31B-it yang secara khusus dioptimalkan untuk tugas copywriting dan penulisan kreatif. Model ini dilatih untuk menghilangkan klise pemasaran generik dan mengadopsi gaya respons langsung yang ditandai dengan spesifikasi konkret dan ajakan bertindak yang ketat.

media r/LocalLLaMA · 8 jam lalu

Menjalankan MiniMax M2.7 Q3 XL pada 6x GPU NVIDIA P40

Seorang pengguna mendetailkan penyebaran berhasil model MiniMax M2.7 Q3_K_XL di enam GPU NVIDIA Tesla P40, menyediakan konfigurasi perangkat keras lengkap dan pengaturan inferensi yang dioptimalkan untuk hosting LLM lokal.

github llama.cpp · 11 jam lalu

Rilis b9860 llama.cpp menambahkan API llama_ftype_name

Proyek llama.cpp telah merilis versi b9860, memperkenalkan fungsi API C publik baru bernama `llama_ftype_name` untuk mengekspos nama tipe file model (kuantisasi).

media r/LocalLLaMA · 11 jam lalu

Agen secara kolaboratif menulis wiki masif tentang RL untuk LLM (200+ makalah sejauh ini) dan siapa saja bisa bergabung

Sebuah proyek kolaboratif sedang berlangsung di mana agen AI menyusun wiki komprehensif tentang pembelajaran penguatan untuk model bahasa besar, telah memproses lebih dari 200 makalah penelitian.

media r/LocalLLaMA · 11 jam lalu

Postingan Reddit mendesak apresiasi bagi pengembang open source

Seorang pengguna Reddit menyoroti kebutuhan mendesak akan rasa syukur terhadap kontributor open-source, dengan mengutip pembaruan cepat terbaru pada vLLM sebagai contoh utama upaya komunitas.

media r/LocalLLaMA · 11 jam lalu

Membangun ulang Gemma 4 31b... lebih baik... Sebagai 26b...

Seorang pengembang menguraikan rencana untuk membangun ulang model Gemma 4 31B dengan mengurangi jumlah parameternya menjadi sekitar 26B sambil bertujuan untuk meningkatkan kinerja. Proyek ini melibatkan perubahan arsitektur, teknik pelatihan khusus, dan kurasi dataset untuk membuat model yang lebih kecil dan efisien.

media r/LocalLLaMA · 11 jam lalu

Memahami agar dapat berpartisipasi

OpenLumara kini menghubungkan UI apa pun ke model lokal melalui endpoint OpenAI

Apakah ada yang menggunakan LLM lokal untuk generasi spasial skala besar atau tata kota dalam perangkat lunak seperti QGIS?

Dual R9700: Rumus terbaik untuk Qwen3.6 27B?

Kernel WebGPU Gemma 4 Mencapai 255 tok/s

Menggunakan DSPy untuk mengevaluasi dan meningkatkan prompt sistem SQL Agen Datasette

Perintis AI Nvidia tolak AGI, bandingkan OpenAI dan Anthropic dengan AOL

Benchmark lokal dengan RTX 3090 - Qwen3.6 27b vs Ornith

Pengguna meminta model visi untuk mendeteksi api atau asap

Analisis 2.3k Aplikasi AI Lokal Mengungkap 82 Kategori dan Berbagai Kasus Penggunaan

Gemma-4-31B yang Ditala Halus untuk Skor Copywriting +290 Elo di EqBench3

Menjalankan MiniMax M2.7 Q3 XL pada 6x GPU NVIDIA P40

Rilis b9860 llama.cpp menambahkan API llama_ftype_name

Agen secara kolaboratif menulis wiki masif tentang RL untuk LLM (200+ makalah sejauh ini) dan siapa saja bisa bergabung

Postingan Reddit mendesak apresiasi bagi pengembang open source

Membangun ulang Gemma 4 31b... lebih baik... Sebagai 26b...

poolside/Laguna-XS-2.1

Kimi K2.7 Code secara umum tersedia di GitHub Copilot

Pengguna Reddit bertanya apakah Ubuntu adalah distro Linux paling kompatibel untuk AI lokal

Dukungan Karakter Unicode pada Unduhan Situs Web