Semua artikel
lab Microsoft Research Blog · 7 hari lalu

Memahami otak dengan penjelasan dan eksperimen berbasis AI

Para peneliti telah mengembangkan Pengujian Kausal Generatif (GCT), sebuah kerangka kerja yang menerjemahkan model prediksi otak berbasis LLM yang tidak dapat diinterpretasi menjadi hipotesis verbal singkat dan dapat diuji tentang fungsi kortikal. Metode ini memadatkan parameter model menjadi frasa-frasa pendek yang menggambarkan wilayah otak spesifik apa yang merespons, seperti "persiapan makanan," lalu memverifikasi penjelasan tersebut melalui eksperimen fMRI yang ditargetkan.

lab Hugging Face Blog · 7 hari lalu

Analisis Akurasi Prediksi Token dalam Model Bahasa Hibrida

Sebuah studi terbaru menyelidiki token spesifik mana yang diprediksi lebih akurat oleh model bahasa hibrida dibandingkan dengan arsitektur padat standar. Penelitian ini berfokus pada pemahaman distribusi kesalahan prediksi di berbagai jenis token, seperti kata langka dan cuplikan kode. Dengan menganalisis lanskap kerugian, penulis mengidentifikasi bahwa model hibrida unggul dalam menangkap ketergantungan jarak jauh di wilayah data jarang. Temuan tersebut menunjukkan bahwa mekanisme campuran ahli memungkinkan pemanfaatan parameter yang lebih efisien selama inferensi. Akurasi yang meningkat ini sangat mencolok untuk token dengan frekuensi rendah dalam korpus pelatihan. Makalah ini memberikan rincian mendetail dari metrik kinerja di berbagai dataset benchmark. Hasil-hasil ini menyoroti potensi arsitektur hibrida untuk menangani struktur linguistik yang beragam secara efektif.

lab Cohere Blog · 7 hari lalu

Cohere Otomatisasi Tanggap Insiden dengan North dan Wiz melalui Server MCP Kustom

Cohere mengembangkan agen keamanan menggunakan platform AI enterprise-nya, Cohere North, yang terintegrasi dengan platform keamanan cloud Wiz melalui server Model Context Protocol (MCP) kustom. Arsitektur ini menghubungkan North ke API GraphQL Wiz melalui delapan alat atomik, memungkinkan alur kerja tanggap insiden otomatis dari satu prompt. Sistem melakukan analisis radius ledakan kombinasi beracun dengan mengevaluasi rantai serangan dan memeringkat risiko berdasarkan paparan internet dan tingkat hak akses dalam sekitar 20 detik. Sistem ini juga mengotomatisasi penyelidikan end-to-end dengan mengambil detail masalah, membuat tiket Linear, memperbarui status Wiz, dan menyusun laporan Tanggap Insiden terstruktur. Selain itu, otomatisasi terjadwal mingguan menghasilkan ringkasan posisi keamanan setiap Senin pagi tanpa intervensi manual. Integrasi ini menghilangkan loop triase sebelumnya yang memakan waktu 30 menit hingga dua jam per temuan, memungkinkan insinyur fokus pada evaluasi penilaian daripada peringatan mentah.