aisuko
/

ft-openelm-270m-ultrafeedback

Text Generation

Generated from Trainer

Model card Files Files and versions Community

aisuko commited on Jun 24

Commit

cb9b7f6

•

1 Parent(s): 45b4df3

End of training

Files changed (3) hide show

README.md +17 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,10 +1,10 @@
 ---
 license: other
 tags:
 - trl
 - orpo
 - generated_from_trainer
-base_model: apple/OpenELM-270M
 model-index:
 - name: ft-openelm-270m-ultrafeedback
   results: []
@@ -16,6 +16,19 @@ should probably proofread and complete it, then remove this comment. -->
 # ft-openelm-270m-ultrafeedback
 This model is a fine-tuned version of [apple/OpenELM-270M](https://huggingface.co/apple/OpenELM-270M) on the HuggingFaceH4/ultrafeedback_binarized dataset.
 ## Model description
@@ -47,6 +60,9 @@ The following hyperparameters were used during training:
 ### Training results
 ### Framework versions

 ---
 license: other
+base_model: apple/OpenELM-270M
 tags:
 - trl
 - orpo
 - generated_from_trainer
 model-index:
 - name: ft-openelm-270m-ultrafeedback
   results: []
 # ft-openelm-270m-ultrafeedback
 This model is a fine-tuned version of [apple/OpenELM-270M](https://huggingface.co/apple/OpenELM-270M) on the HuggingFaceH4/ultrafeedback_binarized dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.6455
+- Rewards/chosen: -0.1995
+- Rewards/rejected: -0.2029
+- Rewards/accuracies: 0.5050
+- Rewards/margins: 0.0035
+- Logps/rejected: -2.0293
+- Logps/chosen: -1.9941
+- Logits/rejected: -5.7383
+- Logits/chosen: -6.1055
+- Nll Loss: 1.5752
+- Log Odds Ratio: -0.7037
+- Log Odds Chosen: 0.0445
 ## Model description
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rewards/chosen | Rewards/rejected | Rewards/accuracies | Rewards/margins | Logps/rejected | Logps/chosen | Logits/rejected | Logits/chosen | Nll Loss | Log Odds Ratio | Log Odds Chosen |
+|:-------------:|:-----:|:----:|:---------------:|:--------------:|:----------------:|:------------------:|:---------------:|:--------------:|:------------:|:---------------:|:-------------:|:--------:|:--------------:|:---------------:|
+| 1.7595        | 0.53  | 100  | 1.6455          | -0.1995        | -0.2029          | 0.5050             | 0.0035          | -2.0293        | -1.9941      | -5.7383         | -6.1055       | 1.5752   | -0.7037        | 0.0445          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8cf2320132870871e63e21ceb620887a6b8d5033bf804a5e20cbcf75ef23eaf
 size 543068816

 version https://git-lfs.github.com/spec/v1
+oid sha256:dec3dca22bc068e2265a0124bbf7b519447af5064cb190f22b9fc0229ee93556
 size 543068816

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f0defbfdf61a624064796d97dd1faeef3d3578d0aff1e5f0368ba4f386c9a49
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:2950a7fef0158105fde8dcf848cc27c651bbc8376406da514b4e5fbba2c278ff
 size 5240