NOVA 100M Image

Modèle autorégressif texte→image < 100 M paramètres.

Architecture

  • Modèle : NOVA Image v3.0 (d=768, 8 couches)
  • Vocabulaire : VQGAN LlamaGen (16384 tokens, f=16)
  • Encodeur texte : t5-small (T5, encodeur seul) figé + cross-attn pool
  • Batch effectif : 32 images

Chargement du tokenizer

from transformers import AutoTokenizer
tok = AutoTokenizer.from_pretrained("ElioChampaney/100m_image_new/tokenizer")

Licences

  • Poids NOVA Image (checkpoints/) : apache-2.0 (ce dépôt)
  • Tokeniseur image (vqgan/) : poids tiers re-hébergés depuis FoundationVision/LlamaGen, licence MIT
Downloads last month
963
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support