o7

o7 er den første reasoning model trænet udelukkende på Dansk.

Modellen er trænet med GRPO (en reinforcement learning metode skabt af DeepSeek) over 8 dage på et enkelt A100.

Instruktion, ingen chat

Modellen er ikke trænet til at svare på opfølgende spørgsmål, og fungerer derfor bedst ved et spørgsmål pr. "chat".

Licens

Følger MIT for privatpersoner og organisationer der vil bruge modellen til forskning. Ved kommercielt brug skal der betales 1 kr. for en livstidslicens. Læs LICENSE.txt for den fulde licens.

Downloads last month
13
Safetensors
Model size
8.03B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for syvai/o7

Finetuned
(1231)
this model