serpdotai
/

sparsetral-16x7B-v2-SPIN_iter0

Text Generation

Inference Endpoints

Model card Files Files and versions Community

francislabounty commited on Feb 18, 2024

Commit

05ea159

·

verified ·

1 Parent(s): 93c3fdc

Update README.md

Files changed (1) hide show

README.md +3 -0

README.md CHANGED Viewed

@@ -10,6 +10,9 @@ language:
 ---
 This model is [sparsetral-16x7B-v2](https://huggingface.co/serpdotai/sparsetral-16x7B-v2) further tuned utilizing [SPIN](https://arxiv.org/abs/2401.01335) on [OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5) mixed with traditional DPO samples. This is iteration_0, plan to keep making iterations until improvements stop.
 ## Training
 - 8x A6000s
 - Base model is [sparsetral-16x7B-v2](https://huggingface.co/serpdotai/sparsetral-16x7B-v2)

 ---
 This model is [sparsetral-16x7B-v2](https://huggingface.co/serpdotai/sparsetral-16x7B-v2) further tuned utilizing [SPIN](https://arxiv.org/abs/2401.01335) on [OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5) mixed with traditional DPO samples. This is iteration_0, plan to keep making iterations until improvements stop.
+Kuru~ Kuru~
+![Kuru~ Kuru~](https://github.com/duiqt/herta_kuru/raw/main/static/img/hertaa_github.gif)
 ## Training
 - 8x A6000s
 - Base model is [sparsetral-16x7B-v2](https://huggingface.co/serpdotai/sparsetral-16x7B-v2)