Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 16

Wmf - teknik eksperimental baru

Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.

LLM Lokal di MacBook M5 Pro - Sama Sekali Baru Dalam Ini!

Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.

media Together AI Blog · 9 jam lalu

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

lab Hugging Face Blog · 10 jam lalu

Hugging Face dan Cerebras menghadirkan Gemma 4 ke AI suara real-time

Hugging Face dan Cerebras telah mengintegrasikan model Gemma 4 dari Google ke dalam platform mereka untuk memungkinkan aplikasi kecerdasan buatan suara real-time. Kolaborasi ini memungkinkan pengembang memanfaatkan kemampuan multimodal Gemma 4 untuk tugas pemrosesan audio dengan latensi rendah.

media Together AI Blog · 10 jam lalu

Mengumumkan pendanaan Seri C senilai $800M untuk mempercepat peralihan ke AI open-source

Perusahaan telah mengumpulkan $800 juta dalam putaran pendanaan Seri C yang bertujuan untuk mempercepat transisi menuju kecerdasan buatan open-source.

lab Hugging Face Blog · 10 jam lalu

ScarfBench: Benchmarking Agen AI untuk Migrasi Framework Java Enterprise

Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.

github CrewAI · 12 jam lalu

Catatan Rilis crewAI 1.15.2a1

Rilis crewAI 1.15.2a1 memperkenalkan beberapa fitur baru, perbaikan bug, dan pembaruan dokumentasi untuk kerangka kerja orkestrasi agen.

github llama.cpp · 17 jam lalu

Rilis llama.cpp b9858 dengan perbaikan jalur model HF

Proyek llama.cpp telah merilis versi b9858, yang mencakup perubahan untuk menggunakan split utama Hugging Face sebagai jalur model. Pembaruan ini menyelesaikan isu #25181 mengenai jalur pemuatan model.

github llama.cpp · 19 jam lalu

Rilis llama.cpp b9857: Penataan ulang Flash Attention dan biner baru

Rilis llama.cpp b9857 memperkenalkan penataan ulang menyeluruh pada implementasi Hexagon Flash Attention, dengan fokus pada optimasi dan peningkatan akurasi. Pembaruan ini mencakup perubahan signifikan pada modul hex-mm dan hex-fa, seperti penggabungan tugas kuantisasi ke dalam utas matmul utama, fusi dengan operasi ADD, dan optimasi pemrosesan mask.

github llama.cpp · 23 jam lalu

Rilis b9855 llama.cpp menambahkan optimisasi AVX2 nvfp4 dan biner baru

Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.

github llama.cpp · 23 jam lalu

Rilis llama.cpp b9856 dengan CUDA restrict + PDL untuk FA

Proyek llama.cpp telah merilis versi b9856, memperkenalkan penggunaan konsisten dari kata kunci `restrict` dan PDL untuk Flash Attention di CUDA. Pembaruan ini disertai dengan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

github llama.cpp · 1 hari lalu

Hapus fallback navigasi PWA untuk mencegah pengodean permintaan titik akhir API

Pembaruan ini menghapus mekanisme fallback navigasi Progressive Web App (PWA). Perubahan ini diterapkan secara khusus untuk mencegah pengodean yang tidak disengaja dari permintaan titik akhir API.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9852 menambahkan dukungan q1_0 OpenCL

Proyek llama.cpp telah merilis versi b9852, memperkenalkan dukungan awal OpenCL untuk format kuantisasi q1_0. Pembaruan ini mencakup kemampuan q1_0 umum dan implementasi GEMM/GEMV Adreno spesifik untuk perangkat OpenCL.

lab Anthropic News · 1 hari lalu

Anthropic Menyiagakan Kembali Fable 5 Setelah Kontrol Ekspor AS

Anthropic memulihkan akses global ke model Claude Fable 5 dan Mythos 5 setelah pemerintah AS mencabut kontrol ekspor yang telah menangguhkan ketersediaan untuk semua pengguna. Fable 5 akan tersedia secara global mulai 1 Juli di Platform Claude, dengan batas penggunaan berlaku hingga 7 Juli sebelum beralih ke akses berbasis kredit.

github llama.cpp · 1 hari lalu

Rilis b9851 llama.cpp memperbaiki pemotongan integer CUDA dan menyediakan biner

Proyek llama.cpp telah merilis versi b9851, yang mencakup perbaikan untuk CUDA guna mencegah kesalahan pemotongan integer dan overflow pada kernel flash_attn_mask_to_KV_max. Pembaruan ini mengatasi masalah terkait langkah-langkah mask KQ dalam kernel yang ditentukan.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9850: perbaikan Qwen3 dan biner baru

Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.

github MCP (GitHub org) · 1 hari lalu

MCP Python SDK v2.0.0b1 Dirilis dengan Dukungan Penuh Spesifikasi 2026

SDK Python Model Context Protocol (MCP) telah merilis versi beta pertamanya, v2.0.0b1, yang memperkenalkan dukungan penuh untuk spesifikasi MCP 2026-07-28. Pra-rilis ini hanya dapat diaktifkan secara opsional, memastikan bahwa instalasi standar tetap mengarah ke jalur stabil 1.x.

lab Microsoft Research Blog · 2 hari lalu

SkillOpt: Keterampilan agen sebagai parameter yang dapat dilatih

Microsoft Research memperkenalkan SkillOpt, sebuah metode yang memperlakukan file keterampilan agen sebagai parameter yang dapat dilatih di luar model target beku, mengubah pengeditan keterampilan manual menjadi proses optimasi terkontrol. Pendekatan ini meningkatkan keandalan dan konsistensi agen tanpa memperbarui bobot model dasar.

lab Anthropic News · 2 hari lalu

Claude Science, sebuah workbench AI untuk ilmuwan, kini tersedia

Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.

lab Anthropic News · 2 hari lalu

Memperkenalkan Claude Sonnet 5

Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.