ecastera
/

eva-mistral-7b-spanish-GGUF

Inference Endpoints

Model card Files Files and versions Community

ecastera commited on Jan 29

Commit

facd732

•

1 Parent(s): d07d3dc

Update README.md

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -1,8 +1,9 @@
 license: apache-2.0
 datasets:
-  - ecastera/wiki_fisica
-  - ecastera/filosofia-es
-  - jtatman/espanol_dolly_alpaca_format_combined
 language:
   - es
   - en
@@ -14,6 +15,7 @@ tags:
   - lora
   - gguf
   - multilingual
 eva-mistral-turdus-7b-spanish
 Mistral 7b-based model fine-tuned in Spanish to add high quality Spanish text generation.
@@ -30,6 +32,7 @@ Quantized using llama.cpp in int4 Q4_0 and int8 Q8_0
 Usage: any framework that uses GGUF format. For native llama.cpp I recommend int4 model quality is not much different from int8 and is almost 2x speed.
 ./main -m $MODEL -c 512 -b 1024 -n 256 --keep 48 \
     --repeat_penalty 1.0 --color -i \
     -r "Enrique:" -f prompts/eva.txt
@@ -46,4 +49,4 @@ llama_print_timings:      sample time =       2,15 ms /    81 runs   (    0,03 m
 llama_print_timings: prompt eval time =    2786,32 ms /    50 tokens (   55,73 ms per token,    17,94 tokens per second)
 llama_print_timings:        eval time =   10806,26 ms /    80 runs   (  135,08 ms per token,     7,40 tokens per second)
 llama_print_timings:       total time =   49858,03 ms /   130 tokens

+---
 license: apache-2.0
 datasets:
+- ecastera/wiki_fisica
+- ecastera/filosofia-es
+- jtatman/espanol_dolly_alpaca_format_combined
 language:
   - es
   - en
   - lora
   - gguf
   - multilingual
+---
 eva-mistral-turdus-7b-spanish
 Mistral 7b-based model fine-tuned in Spanish to add high quality Spanish text generation.
 Usage: any framework that uses GGUF format. For native llama.cpp I recommend int4 model quality is not much different from int8 and is almost 2x speed.
+```
 ./main -m $MODEL -c 512 -b 1024 -n 256 --keep 48 \
     --repeat_penalty 1.0 --color -i \
     -r "Enrique:" -f prompts/eva.txt
 llama_print_timings: prompt eval time =    2786,32 ms /    50 tokens (   55,73 ms per token,    17,94 tokens per second)
 llama_print_timings:        eval time =   10806,26 ms /    80 runs   (  135,08 ms per token,     7,40 tokens per second)
 llama_print_timings:       total time =   49858,03 ms /   130 tokens
+```