Mistral en français ?

#40
by Giroud - opened

Mistral fonctione en français ?

ça dépend. j'ai testé sous ooga booga, en parlant directement en français, il répond dans cette langue, mais le moindre mot en anglais a tendance à le destabiliser.
niveau français, ça reste compréhensible.

Ooga booga ? Je ne vois pas ce que c'est. Pour le moment, j'ai utilisé des versions en ligne : https://labs.perplexity.ai/ et https://huggingface.co/chat/. Mais en conversation en français, les réponses sont incompatibles ou carrément fausses, et parfois la réponse vient en partie en français avec des parties en anglais au milieu, ce qui est vraiment étrange.

Si vous lui donnez un prompt qui dit (en français) "tu es un assistant qui répond en français", il répond normalement en français.
Je l'ai testé avec llama.cpp avec les modèles convertis de TheBloke et ça marche très bien.

A noter que ce modèle dérivé est particulièrement performant (en tout cas pour la discussion de type chat):
https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca

Mon prompt type est:
"""
A partir le maintenant le texte sera en français uniquement...
L'utilisateur donne des instructions et le modèle répond brièvement.
"""

Mettre ensuite un début de dialogue aide également beaucoup pour l'obliger à continuer la conversation en français.
Du coup un prompt type avec le modèle Mistral-7B-Instruct-v0.1 sur llama.cpp donnerait ça:
"""
<s>[INST] Transcription textuelle d'un dialogue, dans laquelle [[USER_NAME]] interagit avec un assistant IA nommé [[AI_NAME]].
[[AI_NAME]] est serviable et répond aux demandes de [[USER_NAME]] en français et avec précision.
[[AI_NAME]] arrête de répondre si il n'est pas certain de dire la vérité.
La transcription comprend uniquement du texte, elle n'inclut pas de balisage comme HTML et Markdown. [/INST]

[INST] [[USER_NAME]] : Bonjour, [[AI_NAME]] ! [/INST]
[[AI_NAME]] : Bonjour [[USER_NAME]] !
[INST] [[USER_NAME]] : En quelle année sommes-nous ? [/INST]
[[AI_NAME]] : Nous sommes en [[DATE_YEAR]].
[INST] [[USER_NAME]] : Veuillez me dire quelle est la plus grande ville d'Europe. [/INST]
[[AI_NAME]] : la plus grande ville d'Europe est Moscou, la capitale de la Russie.
[INST] [[USER_NAME]] : Qu'est-ce qu'un chat ? [/INST]
[[AI_NAME]] : un chat est une espèce domestique de petit mammifère carnivore. C'est la seule espèce domestiquée de la famille des félidés.
[INST] [[USER_NAME]] : nommez une couleur. [/INST]
[[AI_NAME]] : bleu.
[INST] [[USER_NAME]] : Quelle heure est-il ? [/INST]
[[AI_NAME]] : Il est [[DATE_TIME]].
"""

Merci beaucoup pour les informations. Je vais essayer cela.

Voici notre version fine-tunée en français Vigostral-7B-Chat. N'hésitez pas à la tester et à partager vos commentaires !

Merci beaucoup. Je vais essayer cela aussi.

Sign up or log in to comment