Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 19

Wmf - teknik eksperimental baru

Konten artikel telah dihapus oleh penulis, sehingga tidak ada informasi substansial mengenai teknik tersebut.

LLM Lokal di MacBook M5 Pro - Sama Sekali Baru Dalam Ini!

Seorang non-pemrogram berbagi pengalamannya dalam menyiapkan infrastruktur Model Bahasa Besar (LLM) lokal di MacBook M5 Max dengan memori terpadu 128GB. Pengguna mendetailkan tumpukan perangkat lunaknya, pemilihan model, dan tujuannya untuk belajar AI sambil membangun sistem yang stabil dan dapat diakses secara jarak jauh.

media Together AI Blog · 19 jam lalu

Together AI di ICML 2026: riset frontier di seluruh tumpukan

Together AI menyajikan sembilan makalah di ICML 2026 yang mencakup seluruh tumpukan pengembangan platformnya.

lab Hugging Face Blog · 20 jam lalu

ScarfBench: Benchmarking Agen AI untuk Migrasi Framework Java Enterprise

Artikel ini memperkenalkan ScarfBench, sebuah benchmark yang dirancang untuk mengevaluasi kinerja agen AI dalam memigrasikan aplikasi enterprise Java antar framework yang berbeda. Studi ini menyoroti kompleksitas migrasi framework dan mengusulkan metode evaluasi terstandarisasi untuk menilai kemampuan agen di domain ini.

github CrewAI · 22 jam lalu

Catatan Rilis crewAI 1.15.2a1

Rilis crewAI 1.15.2a1 memperkenalkan beberapa fitur baru, perbaikan bug, dan pembaruan dokumentasi untuk kerangka kerja orkestrasi agen.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9857: Penataan ulang Flash Attention dan biner baru

Rilis llama.cpp b9857 memperkenalkan penataan ulang menyeluruh pada implementasi Hexagon Flash Attention, dengan fokus pada optimasi dan peningkatan akurasi. Pembaruan ini mencakup perubahan signifikan pada modul hex-mm dan hex-fa, seperti penggabungan tugas kuantisasi ke dalam utas matmul utama, fusi dengan operasi ADD, dan optimasi pemrosesan mask.

github llama.cpp · 1 hari lalu

Rilis b9855 llama.cpp menambahkan optimisasi AVX2 nvfp4 dan biner baru

Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.

github llama.cpp · 1 hari lalu

Rilis llama.cpp b9856 dengan CUDA restrict + PDL untuk FA

Proyek llama.cpp telah merilis versi b9856, memperkenalkan penggunaan konsisten dari kata kunci `restrict` dan PDL untuk Flash Attention di CUDA. Pembaruan ini disertai dengan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

github llama.cpp · 2 hari lalu

Hapus fallback navigasi PWA untuk mencegah pengodean permintaan titik akhir API

Pembaruan ini menghapus mekanisme fallback navigasi Progressive Web App (PWA). Perubahan ini diterapkan secara khusus untuk mencegah pengodean yang tidak disengaja dari permintaan titik akhir API.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9852 menambahkan dukungan q1_0 OpenCL

Proyek llama.cpp telah merilis versi b9852, memperkenalkan dukungan awal OpenCL untuk format kuantisasi q1_0. Pembaruan ini mencakup kemampuan q1_0 umum dan implementasi GEMM/GEMV Adreno spesifik untuk perangkat OpenCL.

lab Anthropic News · 2 hari lalu

Anthropic Menyiagakan Kembali Fable 5 Setelah Kontrol Ekspor AS

Anthropic memulihkan akses global ke model Claude Fable 5 dan Mythos 5 setelah pemerintah AS mencabut kontrol ekspor yang telah menangguhkan ketersediaan untuk semua pengguna. Fable 5 akan tersedia secara global mulai 1 Juli di Platform Claude, dengan batas penggunaan berlaku hingga 7 Juli sebelum beralih ke akses berbasis kredit.

github llama.cpp · 2 hari lalu

Rilis b9851 llama.cpp memperbaiki pemotongan integer CUDA dan menyediakan biner

Proyek llama.cpp telah merilis versi b9851, yang mencakup perbaikan untuk CUDA guna mencegah kesalahan pemotongan integer dan overflow pada kernel flash_attn_mask_to_KV_max. Pembaruan ini mengatasi masalah terkait langkah-langkah mask KQ dalam kernel yang ditentukan.

github llama.cpp · 2 hari lalu

Rilis llama.cpp b9850: perbaikan Qwen3 dan biner baru

Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.

github MCP (GitHub org) · 2 hari lalu

MCP Python SDK v2.0.0b1 Dirilis dengan Dukungan Penuh Spesifikasi 2026

SDK Python Model Context Protocol (MCP) telah merilis versi beta pertamanya, v2.0.0b1, yang memperkenalkan dukungan penuh untuk spesifikasi MCP 2026-07-28. Pra-rilis ini hanya dapat diaktifkan secara opsional, memastikan bahwa instalasi standar tetap mengarah ke jalur stabil 1.x.

lab Microsoft Research Blog · 2 hari lalu

SkillOpt: Keterampilan agen sebagai parameter yang dapat dilatih

Microsoft Research memperkenalkan SkillOpt, sebuah metode yang memperlakukan file keterampilan agen sebagai parameter yang dapat dilatih di luar model target beku, mengubah pengeditan keterampilan manual menjadi proses optimasi terkontrol. Pendekatan ini meningkatkan keandalan dan konsistensi agen tanpa memperbarui bobot model dasar.

lab Anthropic News · 2 hari lalu

Claude Science, sebuah workbench AI untuk ilmuwan, kini tersedia

Anthropic telah meluncurkan Claude Science dalam tahap beta, sebuah workbench AI yang dirancang untuk mengintegrasikan alat-alat ilmiah yang terfragmentasi ke dalam satu lingkungan penelitian. Platform ini bertujuan mempercepat penemuan dengan menyediakan artefak yang dapat diaudit, skalabilitas komputasi yang fleksibel, dan agen khusus untuk domain seperti genomik dan biologi struktural.

lab Anthropic News · 2 hari lalu

Memperkenalkan Claude Sonnet 5

Anthropic telah merilis Claude Sonnet 5, model AI agentic baru yang dirancang untuk melakukan perencanaan kompleks, penggunaan alat, dan tugas pemrograman otonom dengan biaya lebih rendah dibandingkan model kelas Opus sebelumnya. Pembaruan ini menyempitkan kesenjangan kinerja dengan Opus 4.8 sambil menawarkan peningkatan signifikan dalam penalaran, keamanan, dan eksekusi dibandingkan pendahulunya, Sonnet 4.6.

lab Claude Code Releases · 2 hari lalu

Claude Code v2.1.197 memperkenalkan Claude Sonnet 5

Anthropic telah merilis versi 2.1.197 dari Claude Code, yang memperbarui model default menjadi Claude Sonnet 5. Model baru ini memiliki jendela konteks native 1M-token dan tersedia dengan harga promosi hingga 31 Agustus.

lab OpenAI News · 2 hari lalu

Di Dalam GeneBench-Pro: 10 Studi Kasus Penalaran Genomik Kompleks

GeneBench-Pro adalah benchmark yang dirancang untuk mengevaluasi model pada tugas penalaran genomik kompleks, menampilkan sepuluh studi kasus terperinci yang menunjukkan pertanyaan representatif dan materi pendukung. Setiap studi kasus menyediakan prompt asli, dataset, dan konteks yang diperlukan untuk menilai kinerja model pada tantangan biologis spesifik.

lab OpenAI News · 2 hari lalu

Memperkenalkan GeneBench-Pro

GeneBench-Pro adalah benchmark tingkat penelitian yang dirancang untuk mengukur bagaimana agen AI menangani ambiguitas dan membuat penilaian konsekuensial dalam biologi komputasi, dengan memperluas dari GeneBench asli. Ini mengatasi keterbatasan evaluasi saat ini dengan menguji kemampuan tingkat tinggi seperti menangani noise data, merevisi asumsi, dan menentukan kapan hasil siap untuk pengambilan keputusan.