NOVA 100M Image
Modèle autorégressif texte→image < 100 M paramètres.
Architecture
- Modèle : NOVA Image v3.0 (d=768, 8 couches)
- Vocabulaire : DALL-E dVAE (8192 tokens, f=8)
- Encodeur texte :
distilbert-base-uncasedfigé + cross-attn pool - Batch effectif : 32 images
Chargement du tokenizer
from transformers import DistilBertTokenizerFast
tok = DistilBertTokenizerFast.from_pretrained("ElioChampaney/100m_image/tokenizer")
- Downloads last month
- 887