Wiro AI French Flag

πŸš€ OpenR1-Qwen-7B-French πŸš€

This is a finetune of Qwen2.5-Instruct on WiroAI/dolphin-r1-french.

🟒 Overview

  • DeepSeek's distilled models sometimes reason in Chinese or English even though prompted in another language.
  • Open-Source models still need improvement on relatively low-resource languages.
  • A motivation to reproduce R1 and contribute to the community.

🟒 Training

  • We train the model on the WiroAI/dolphin-r1-french for 2 epochs. We use learning rate of 1e-5 and max seq length 4096. The training follows a cosine learning rate schedule with a 10% warmup phase.
  • Training took 5 days in 8xA6000 ADA cluster.
  • Normally, R1 team compares the performance of OpenR1 models to DeepSeek-Distill-Qwen-7B and OpenThinker-7B using lighteval. However, the datasets are only MATH oriented so not to conclude anything we won't disclose the default results.

You can find the training and evaluation code at: https://github.com/huggingface/open-r1/

🐨 Quick start

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "OpenR1-Qwen-7B-French"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "Explique brièvement l'importance des investissements que la France réalise pour progresser dans le domaine de l'intelligence artificielle."

messages = [
    {"role": "system", "content": "Veuillez rΓ©flΓ©chir Γ©tape par Γ©tape avant de rΓ©pondre."},
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=4096
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
'<|begin_of_thought|>
D\'accord, je dois expliquer pourquoi les investissements de la France en matière d\'IA sont importants. Commençons par rappeler ce que je sais du développement de l\'IA en France.
Tout d\'abord, la France a un fort écosystème technologique. Il y a des universités renommées comme l\'École Polytechnique et l\'Institut Polytechnique de Paris, qui produisent probablement beaucoup de talents en ingénierie et en sciences. De plus, il y a des entreprises technologiques qui opèrent là-bas, donc le pays pourrait avoir une base solide pour l\'innovation.
Ensuite, il y a l\'initiative IA France. Je me souviens qu\'elle a Γ©tΓ© lancΓ©e en 2018 pour faire de la France un leader mondial de l\'IA. Les investissements comprennent probablement des fonds publics, des subventions et des partenariats avec des industries. Le but est de stimuler la recherche et le dΓ©veloppement (R&D), de soutenir les startups et de crΓ©er des emplois.
L\'accès à la main-d\'œuvre qualifiée est important. La France possède une forte présence académique et des programmes d\'enseignement supérieur axés sur l\'IA. Des institutions comme INRIA me viennent à l\'esprit ; c\'est une organisation de recherche en informatique fondée en France. Ils contribuent à la recherche en IA et collaborent avec des entreprises.
Les startups et les startups font également partie du paysage français. L\'écosystème de la startup à Paris est connu sous le nom de "La Défense" ou quelque chose de similaire. Ces startups ont besoin de financement et de ressources pour évoluer. Les investissements gouvernementaux peuvent aider à accélérer leur croissance et à attirer davantage de capitaux privés.
Le rΓ΄le de l\'industrie est un autre aspect. Des entreprises comme Thales et Dassault Systemes utilisent probablement l\'IA dans leurs secteurs respectifs, comme la dΓ©fense et l\'aΓ©rospatiale. L\'investissement dans l\'IA peut aider ces entreprises Γ  rester compΓ©titives et Γ  innover.
L\'objectif de l\'IA pour la sociΓ©tΓ© comprend probablement des applications dans la santΓ©, l\'Γ©ducation et la durabilitΓ©. Par exemple, l\'utilisation de l\'IA pour le diagnostic mΓ©dical ou les technologies vertes. Cela montre comment l\'IA peut avoir un impact positif sur la sociΓ©tΓ© au-delΓ  simplement de la technologie.
Les partenariats internationaux pourraient Γͺtre un facteur. L\'Europe a besoin de s\'unir pour la compΓ©tition mondiale, et les investissements de la France dans l\'IA pourraient se faire en collaboration avec d\'autres nations europΓ©ennes. De plus, les collaborations avec les Γ‰tats-Unis et la Chine pourraient faire partie de stratΓ©gies mondiales.
Le soutien politique et rΓ©glementaire est essentiel. La France pourrait avoir des politiques visant Γ  promouvoir l\'adoption de l\'IA tout en maintenant la responsabilitΓ© Γ©thique. Les investissements pourraient inclure la crΓ©ation de cadres juridiques pour garantir la confidentialitΓ© des donnΓ©es et Γ©viter la discrimination.
La crΓ©ation d\'emplois est un autre avantage Γ©conomique. L\'essor de l\'IA crΓ©e des opportunitΓ©s dans le dΓ©veloppement de logiciels, l\'apprentissage automatique et d\'autres domaines techniques. Cela aide l\'Γ©conomie Γ  se diversifier et Γ  attirer les talents internationaux.
La rΓ©silience face aux crises pourrait Γͺtre un avantage. Pendant la pandΓ©mie de COVID-19, l\'IA a Γ©tΓ© utilisΓ©e pour la modΓ©lisation prΓ©dictive et le dΓ©pistage. La capacitΓ© de la France Γ  utiliser efficacement l\'IA pendant cette pΓ©riode a mis en Γ©vidence ses progrΓ¨s.
Les dΓ©fis potentiels ne sont pas mentionnΓ©s ici, mais je devrais peut-Γͺtre les noter briΓ¨vement. Les problΓ¨mes de pΓ©nurie de talents, de fragmentation rΓ©glementaire et de concurrence internationale. Cependant, la question porte sur l\'importance des investissements, donc se concentrer sur les points positifs est logique.
En résumé, les investissements de la France dans l\'IA stimulent la recherche, favorisent l\'innovation, créent des emplois, renforcent l\'industrie nationale et positionnent le pays comme un leader mondial. Cela contribue à la compétitivité économique, à la résolution de problèmes sociétaux et à la construction d\'une infrastructure technologique durable.\n
<|end_of_thought|>
<|begin_of_solution|>
Les investissements de la France dans l\'IA sont cruciaux pour plusieurs raisons :
1. **Stimulation de la recherche et du dΓ©veloppement** :\n   - L\'initiative IA France (2018) alloue des fonds publics pour financer des projets de R&D, des partenariats universitaires et des startups, consolidant ainsi la position de la France en tant que leader de l\'IA.
2. **Renforcement de l\'écosystème technologique** :\n   - Des institutions comme l\'INRIA et des universités renommées (par exemple, l\'École Polytechnique) produisent des talents qualifiés en ingénierie et en sciences, alimentant ainsi les startups et les industries.\n   - L\'écosystème de la startup parisien (par exemple, "La Défense") attire des investissements privés et favorise l\'innovation.
3. **Impact Γ©conomique et crΓ©ation d\'emplois** :\n   - L\'IA stimule les secteurs clΓ©s comme la dΓ©fense, l\'aΓ©rospatiale et la santΓ©, crΓ©ant des opportunitΓ©s d\'emploi et diversifiant l\'Γ©conomie.\n   - La crΓ©ation d\'entreprises de pointe (par exemple, Deeptech) contribue Γ  l\'indΓ©pendance industrielle et Γ  la croissance Γ©conomique.
4. **Applications sociales et éthiques** :\n   - Les applications de l\'IA dans la santé, l\'éducation et la durabilité améliorent la qualité de vie et la résilience face aux crises.\n   - Les cadres juridiques (par exemple, la loi française sur la protection des données) favorisent la confiance et la responsabilité éthique.
5. **Partenariats internationaux** :\n   - La collaboration avec des pays européens et mondiaux (par exemple, l\'UE) renforce la compétition mondiale et l\'innovation transfrontalière.
6. **Adaptation à la transformation numérique** :\n   - L\'IA permet aux industries françaises de rester compétitives dans un monde dominé par la technologie, préparant ainsi la France à une croissance durable.
En combinant les ressources acadΓ©miques, les investissements publics et les initiatives de partenariat, les investissements de la France dans l\'IA visent Γ  stimuler la croissance Γ©conomique, Γ  relever les dΓ©fis sociΓ©taux et Γ  positionner le pays comme un acteur mondial de premier plan dans ce domaine.
<|end_of_solution|>'

🟑 Evaluation

  • We observed that reasoning process has slightly improved. Our model thinks more clearly in French compared to the DeepSeek's reasoning model.
  • This model trained for experimental motives and any benchmark evaluation is appreciated. Please be aware that this model will be producing more tokens compared to normal models and will consume more VRAM during inference.
  • If you are willing to evaluate this model please make sure that model will be allowed to produce enough tokens. Generate until requests that restrict the model to output less than 4000 tokens will lead to poor results.
  • We believe democratized and culturally improved open-source models will be through sharing and experiments!

πŸ€— Community

  • We would like to thank Huggingface Staff and everyone who contributed to the Open-R1 project!

Citation

@article{WiroAI,
  title={WiroAI/OpenR1-Qwen-7B-French,
  author={Abdullah Bezir, Cengiz Asmazoğlu},
  year={2025},
  url={https://huggingface.co/WiroAI/OpenR1-Qwen-7B-French}
}
Downloads last month
634
Safetensors
Model size
7.62B params
Tensor type
BF16
Β·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for WiroAI/OpenR1-Qwen-7B-French

Base model

Qwen/Qwen2.5-7B
Finetuned
(738)
this model

Dataset used to train WiroAI/OpenR1-Qwen-7B-French