Hugging Face внедрила недавнее изменение, блокирующее ускорение многопоточных загрузок, что приводит к ошибкам 403 для всех потоков, кроме одного, в рамках одного соединения. Это обновление существенно влияет на экосистему GGUF, где распространены большие однофайловые модели, а скорости однопоточных загрузок часто ограничены значением 40 МБ/с. Ранее инструменты, такие как CLI Hugging Face, ускоряли загрузки путем параллельного получения множества меньших файлов, однако этот метод теперь затруднен данным ограничением. Автор отмечает, что загрузка всей ветки репозиториев GGUF неэффективна из-за наличия больших файлов и нескольких квантизаций в одной и той же ветке. Без отмены этой политики скорости загрузки останутся низкими, если только создатели контента не перейдут на разделение моделей на множество меньших файлов в разных ветках. Такой обходной путь потребует от пользователей ручного объединения файлов, что считается менее предпочтительным вариантом по сравнению с восстановлением Hugging Face предыдущих возможностей ускорения.