NanoI2V: Membangun Model Image-to-Video dari Awal

NanoI2V adalah proyek open-source yang mengimplementasikan model generasi Image-to-Video dari awal, dengan tujuan memberikan referensi yang bersih dan edukatif untuk teknik generasi video modern. Repositori ini mengutamakan keterbacaan dan reproduktibilitas dibandingkan kompleksitas yang ditemukan di sebagian besar proyek state-of-the-art.

Mengimplementasikan komponen inti secara modular menggunakan PyTorch.
Mencakup arsitektur berbasis Transformer serta metode pelatihan diffusion atau flow-matching.
Menyediakan komponen independen yang dapat dimodifikasi untuk eksperimen dengan pipeline generasi.
Berfokus pada penjelasan blok bangunan daripada membungkus model black-box yang sudah ada.

Proyek ini dirancang untuk membantu peneliti dan mahasiswa memahami bagaimana potongan-potongan generasi video saling terhubung dengan menghindari ribuan baris kode framework.