В репозиторий llama.cpp объединён pull request, поддерживающий DeepSeek V4, что позволяет пользователям запускать модель локально.
- Слияние доступно по адресу https://github.com/ggml-org/llama.cpp/pull/24162.
- Пользователи могут обновить свою установку с помощью git pull и cmake.
- Веса модели распространяются в формате GGUF.