Spaces:

jeanbaptdzd
/

open-finance-llm-8b

Paused

open-finance-llm-8b / docs /generation_limits.md

chore: Clean up repo - remove redundant tests and docs, update README

3e6b9d2 25 days ago

2.34 kB

Limites de génération - Qwen-3 8B

20 000 tokens peuvent être générés en sortie (selon les spécifications Qwen-3 8B).

La limite pratique dépend de la fenêtre de contexte disponible:

max_tokens_generable = fenêtre_contexte - tokens_entrée - marge_sécurité

Contexte d'entrée	Fenêtre totale	Max génération	Marge
2K tokens	32K	~30K tokens	✅ Large
10K tokens	32K	~22K tokens	✅ Bonne
20K tokens	32K	~12K tokens	✅ Suffisant
30K tokens	32K	~2K tokens	⚠️ Limite
50K tokens	128K (YaRN)	~78K tokens	✅ Très large

agent_short = Agent(
    finance_model,
    model_settings=ModelSettings(max_output_tokens=800),
)

agent_long = Agent(
    finance_model,
    model_settings=ModelSettings(max_output_tokens=2000),
)

agent_very_long = Agent(
    finance_model,
    model_settings=ModelSettings(max_output_tokens=5000),
)
# Nécessite que l'entrée soit < 27K tokens

Note: Au-delà de 5000 tokens, vérifiez que votre contexte d'entrée n'est pas trop volumineux.