Un investigador independiente ha presentado ZATRON (Zero-Access Transformed Retrieval Over Noise), un método que transforma las incrustaciones de búsqueda semántica en códigos de barras modulares ilegibles mientras preserva la calidad de recuperación. El sistema utiliza proyección PCA, cuantización y enmascaramiento criptográfico para evitar que las bases de datos vectoriales filtren las estructuras temáticas de los documentos a través del agrupamiento.
- Probado en MSMARCO con 626 906 documentos, ZATRON preserva el 98,2 % de la calidad de búsqueda coseno.
- El rendimiento varía según el modelo: MiniLM (98,2 %), MPNet (99,2 %) y BGE (86,6 %).
- El método mantiene más del 88 % de calidad en cinco idiomas, incluyendo árabe, español, coreano, chino e inglés.
- ZATRON es 8 veces más rápido que la Cifrado Homomórfico Completo (CKKS) a 5 ms por comparación frente a 38,9 ms.
El autor busca comentarios técnicos de la comunidad de búsqueda vectorial mientras presenta una patente para esta técnica de codificación que preserva la privacidad.