GLM-5.2 模型的 DSA 索引器在所有层上被错误加载,导致因缺少张量而失败。此次更新将索引器张量标记为 TENSOR_NOT_REQUIRED,使得没有索引器的层可以以 nullptr 形式加载,并启用完整的 MLA 注意力机制。DeepSeek-V3.2 由于采用统一索引,不受影响。
GLM-5.2 DSA 索引器修复:标记张量非必需
译自 English → 中文
GLM-5.2 模型的 DSA 索引器在所有层上被错误加载,导致因缺少张量而失败。此次更新将索引器张量标记为 TENSOR_NOT_REQUIRED,使得没有索引器的层可以以 nullptr 形式加载,并启用完整的 MLA 注意力机制。DeepSeek-V3.2 由于采用统一索引,不受影响。