В репозиторий llama.cpp объединён pull request, поддерживающий DeepSeek V4, что позволяет пользователям запускать модель локально.

  • Слияние доступно по адресу https://github.com/ggml-org/llama.cpp/pull/24162.
  • Пользователи могут обновить свою установку с помощью git pull и cmake.
  • Веса модели распространяются в формате GGUF.