该技术报告介绍了一种“认证后校正”(Certify-then-Rectify)框架,它将分层可导航小世界(HNSW)图的速度与理论正确性保证相结合。该方法动态评估搜索质量,并在需要时升级到精确恢复算法,确保最坏情况下的准确性。
- 使用无分布统计认证器以最小的开销评估HNSW搜索质量。
- 将HNSW图重新解释为几何生成器,以限制真实最近邻的最大距离。
- 应用极值理论随机估计最大经验拉伸因子。
- 在保持精确搜索的最坏情况正确性的同时,提供HNSW的平均情况速度。
这种方法弥合了启发式搜索与严格检索之间的差距,在基准数据集上优于其他适用的方法。