wenbopan
/

Faro-Yi-34B-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

wenbopan commited on Apr 10, 2024

Commit

dbb5225

·

verified ·

1 Parent(s): dc5be82

Update README.md

Files changed (1) hide show

README.md +10 -39

README.md CHANGED Viewed

@@ -1,43 +1,14 @@
 ---
 base_model: []
-library_name: transformers
-tags:
-- mergekit
-- merge
 ---
-# Faro-34B-Slerp
-This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
-## Merge Details
-### Merge Method
-This model was merged using the SLERP merge method.
-### Models Merged
-The following models were included in the merge:
-* /cephfs/panwenbo/work/models/Faro-34B-DPO
-* /cephfs/panwenbo/work/models/Faro-34B
-### Configuration
-The following YAML configuration was used to produce this model:
-```yaml
-models:
-  - model: /cephfs/panwenbo/work/models/Faro-34B-DPO
-  - model: /cephfs/panwenbo/work/models/Faro-34B
-merge_method: slerp
-base_model: /cephfs/panwenbo/work/models/Faro-34B
-parameters:
-  t:
-    - filter: self_attn
-      value: [0, 0.5, 0.3, 0.7, 1]
-    - filter: mlp
-      value: [1, 0.5, 0.7, 0.3, 0]
-    - value: 0.5 # fallback for rest of tensors
-dtype: bfloat16
-```

 ---
 base_model: []
+license: mit
+datasets:
+- wenbopan/Chinese-dpo-pairs
+- Intel/orca_dpo_pairs
+language:
+- en
+- zh
+pipeline_tag: text-generation
 ---
+# Faro-Yi-34B-DPO
+Faro-Yi-34B-DPO is the DPO version of Faro-Yi-34B.