fairydreaming 将 DeepSeek V4 的量化 KV 缓存修复合并到 llama.cpp

用户 fairydreaming 已将拉取请求合并到其 llama.cpp 分支，以启用 DeepSeek V4 模型的量化键值 (KV) 缓存支持。这些更改包含了来自 PRs #25247、#25303 和 #25202 的修复，省略了一些填充调整。

这些更新允许用户通过量化缓存以较低的内存使用量运行 DeepSeek V4，同时保持接近全精度模型的性能。