Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 19

Context Gravity

Chris Diaz telah membagikan proyek baru bernama Context Gravity, yang saat ini tersedia di GitHub. Penulis sedang mencari umpan balik komunitas mengenai repositori tersebut.

media Hugging Face Forums · 15 jam lalu

Prism Transformer: Jadwal Kepala Progresif untuk Pemrosesan Perhatian Hierarkis

Prism Transformer memperkenalkan jadwal kepala progresif yang bervariasi jumlah kepala perhatian di seluruh lapisan, dimulai dengan lebih sedikit kepala lebar di lapisan awal dan meningkat secara monoton seiring kedalaman. Pendekatan ini menantang alokasi seragam standar dengan memenuhi kebutuhan struktural yang berbeda antara lapisan awal dan akhir tanpa menambah overhead arsitektur.

github CrewAI · 15 jam lalu

Catatan Rilis LangChain v1.15.2a2

Rilis ini memperbarui LangChain dengan fitur baru untuk integrasi Bedrock, dokumentasi agen aliran, dan navigasi streaming, bersama dengan perbaikan bug dan peningkatan dokumentasi.

media Hugging Face Forums · 16 jam lalu

Fractal Dreaming + Perencanaan Terinspirasi Kuantum: Alat Penemuan Pengetahuan yang Berorganisasi Sendiri dengan DeepSeek Coder

Penulis menyajikan alat penemuan pengetahuan yang berorganisasi sendiri yang mengintegrasikan generasi pola fraktal dan superposisi terinspirasi kuantum untuk meningkatkan eksplorasi ruang pengetahuan oleh DeepSeek Coder. Sistem ini mengoptimalkan lintasan pencarian dengan menyimpan jalur kreatif yang berhasil sebagai kueri yang di-cache, bukan memori, menyesuaikan penggunaan sumber daya berdasarkan kendala perangkat keras.

media Hugging Face Forums · 16 jam lalu

Wmf - teknik eksperimental baru

Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.

media Hugging Face Forums · 16 jam lalu

LLM Lokal di MacBook M5 Pro - Sama Sekali Baru Dalam Ini!

Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.

media Together AI Blog · 17 jam lalu

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

lab Hugging Face Blog · 18 jam lalu

Hugging Face dan Cerebras menghadirkan Gemma 4 ke AI suara real-time

Hugging Face dan Cerebras telah mengintegrasikan model Gemma 4 dari Google ke dalam platform mereka untuk memungkinkan aplikasi kecerdasan buatan suara real-time. Kolaborasi ini memungkinkan pengembang memanfaatkan kemampuan multimodal Gemma 4 untuk tugas pemrosesan audio dengan latensi rendah.

media Together AI Blog · 18 jam lalu

Mengumumkan pendanaan Seri C senilai $800M untuk mempercepat peralihan ke AI open-source

Perusahaan telah mengumpulkan $800 juta dalam putaran pendanaan Seri C yang bertujuan untuk mempercepat transisi menuju kecerdasan buatan open-source.

lab Hugging Face Blog · 18 jam lalu

ScarfBench: Benchmarking Agen AI untuk Migrasi Framework Java Enterprise

Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.

github CrewAI · 19 jam lalu

Catatan Rilis crewAI 1.15.2a1

Rilis crewAI 1.15.2a1 memperkenalkan beberapa fitur baru, perbaikan bug, dan pembaruan dokumentasi untuk kerangka kerja orkestrasi agen.

lab Claude Code Releases · 22 jam lalu

Catatan Rilis Claude Code v2.1.198

Pembaruan v2.1.198 untuk Claude Code memperkenalkan ketersediaan umum untuk Claude di Chrome dan meningkatkan kemampuan agen latar belakang dengan hook notifikasi baru dan alur kerja pull request otomatis.

lab Google — The Keyword (AI) · 22 jam lalu

Pendidik dan pemimpin industri NYC berkumpul di Google untuk membentuk AI di kelas

Google, Dewan CEO Pekerjaan New York, dan Urban Assembly menyelenggarakan puncak AI untuk 150 pemimpin pendidikan dan industri di kantor Google. Acara tersebut mempertemukan para pemangku kepentingan untuk membahas dan membentuk masa depan integrasi kecerdasan buatan dalam lingkungan kelas.

lab Google — The Keyword (AI) · 22 jam lalu

Berita AI Terbaru dari Google yang Diumumkan pada Juni 2026

Artikel ini menyajikan ringkasan pembaruan dan pengumuman kecerdasan buatan yang dirilis oleh Google selama Juni 2026.

github llama.cpp · 23 jam lalu

Rilis b9859 llama.cpp menambahkan dukungan kernel precompiled OpenCL

Rilis b9859 llama.cpp memperkenalkan kemampuan untuk memuat kernel biner precompiled dari pustaka untuk OpenCL, khususnya menargetkan GPU Adreno. Pembaruan ini juga menyediakan biner untuk macOS, Linux, Windows, Android, dan openEuler di seluruh CPU, GPU, dan berbagai backend akselerator.

lab xAI News · 1 hari lalu

xAI Luncurkan Pembuat Agen Suara Tanpa Kode untuk Grok Voice

xAI telah mengumumkan rilis beta Voice Agent Builder, sebuah platform tanpa kode yang dirancang untuk mengonfigurasi agen suara tingkat produksi di Grok Voice dalam waktu kurang dari dua menit. Alat ini memungkinkan operator dan pengembang untuk mendeploy agen suara dengan volume tinggi tanpa membangun tumpukan telekomunikasi atau AI dasar dari awal.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9858 dengan perbaikan jalur model HF

Proyek llama.cpp telah merilis versi b9858, yang mencakup perubahan untuk menggunakan split utama Hugging Face sebagai jalur model. Pembaruan ini menyelesaikan isu #25181 mengenai jalur pemuatan model.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9857: Penataan ulang Flash Attention dan biner baru

Rilis llama.cpp b9857 memperkenalkan penataan ulang menyeluruh pada implementasi Hexagon Flash Attention, dengan fokus pada optimasi dan peningkatan akurasi. Pembaruan ini mencakup perubahan signifikan pada modul hex-mm dan hex-fa, seperti penggabungan tugas kuantisasi ke dalam utas matmul utama, fusi dengan operasi ADD, dan optimasi pemrosesan mask.

github llama.cpp · 1 hari lalu

Rilis b9855 llama.cpp menambahkan optimisasi AVX2 nvfp4 dan biner baru

Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9856 dengan CUDA restrict + PDL untuk FA

Proyek llama.cpp telah merilis versi b9856, memperkenalkan penggunaan konsisten dari kata kunci `restrict` dan PDL untuk Flash Attention di CUDA. Pembaruan ini disertai dengan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.