Um pesquisador independente apresentou o ZATRON (Zero-Access Transformed Retrieval Over Noise), um método que transforma embeddings de busca semântica em códigos de barras modulares ilegíveis, preservando a qualidade da recuperação. O sistema usa projeção PCA, quantização e mascaramento criptográfico para evitar que bancos de dados vetoriais vazem estruturas de tópicos de documentos por meio de agrupamento.
- Testado no MSMARCO com 626.906 documentos, o ZATRON preserva 98,2% da qualidade da busca cosseno.
- O desempenho varia conforme o modelo: MiniLM (98,2%), MPNet (99,2%) e BGE (86,6%).
- O método mantém mais de 88% de qualidade em cinco idiomas, incluindo árabe, espanhol, coreano, chinês e inglês.
- O ZATRON é 8x mais rápido que a Criptografia Homomórfica Total (CKKS) em 5ms por comparação versus 38,9ms.
O autor busca feedback técnico da comunidade de busca vetorial enquanto registra uma patente para esta técnica de codificação que preserva a privacidade.