Seorang peneliti independen telah memperkenalkan ZATRON (Zero-Access Transformed Retrieval Over Noise), sebuah metode yang mengubah embedding pencarian semantik menjadi barcode modular yang tidak dapat dibaca sambil mempertahankan kualitas pengambilan. Sistem ini menggunakan proyeksi PCA, kuantisasi, dan masker kriptografi untuk mencegah basis data vektor membocorkan struktur topik dokumen melalui klasterisasi.
- Diuji pada MSMARCO dengan 626.906 dokumen, ZATRON mempertahankan 98,2% kualitas pencarian kosinus.
- Performa bervariasi menurut model: MiniLM (98,2%), MPNet (99,2%), dan BGE (86,6%).
- Metode ini mempertahankan kualitas lebih dari 88% di lima bahasa termasuk Arab, Spanyol, Korea, Mandarin, dan Inggris.
- ZATRON 8x lebih cepat daripada Enkripsi Homomorfik Penuh (CKKS) pada 5ms per perbandingan versus 38,9ms.
Penulis mencari umpan balik teknis dari komunitas pencarian vektor saat mereka mengajukan paten untuk teknik pengodean yang menjaga privasi ini.