NanoI2V — это проект с открытым исходным кодом, реализующий модель генерации видео из изображений с нуля, цель которого — предоставить чистую и образовательную ссылку на современные методы генерации видео. В репозитории приоритет отдается читаемости и воспроизводимости, а не сложности, присущей большинству современных проектов.

  • Реализует основные компоненты модульным способом с использованием PyTorch.
  • Охватывает архитектуры на основе Transformer и методы обучения диффузии или flow-matching.
  • Предоставляет независимые, изменяемые компоненты для экспериментов с конвейером генерации.
  • Фокусируется на объяснении строительных блоков, а не на обертывании существующих моделей типа черного ящика.

Проект разработан, чтобы помочь исследователям и студентам понять, как части генерации видео складываются вместе, избегая тысяч строк кода фреймворка.