etri-xainlp
/

SOLAR-10.7B-merge-dpo

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

etri-xainlp commited on Mar 4

Commit

c0027e7

•

1 Parent(s): f397f9d

Update README.md

Files changed (1) hide show

README.md +24 -0

README.md CHANGED Viewed

@@ -1,3 +1,27 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
 ---
+# etri-xainlp/SOLAR-10.7B-merge-dpo
+## Model Details
+**Model Developers** ETRI xainlp team
+**Input** text only.
+**Output** text only.
+**Model Architecture**
+We used MergeKit to merge Model heavytail/kullm-solar into Model upstage/SOLAR-10.7B-Instruct-v1.0 as the base.
+**Base Model**  [upstage/SOLAR-10.7B-Instruct-v1.0](https://huggingface.co/upstage/SOLAR-10.7B-Instruct-v1.0)
+**Merge Model  [heavytail/kullm-solar](https://huggingface.co/heavytail/kullm-solar)
+**Training Dataset**
+ - dpo+lora: 90k user preference set
+ - We use A100 GPU 80GB * 1, when training.