tlphams
/

gollm-12.8b-instruct-v2.3

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

tlphams commited on Nov 8, 2023

Commit

3eb7569

·

1 Parent(s): 49b129a

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -54,7 +54,8 @@ More information needed
 - High-quality reasoning dataset from private documents, QAs generated by Claude AI (1.3k samples)
 - EverythingLM-v2 (0.9k samples)
 - KoCoT (2k samples)
-- Private MRC dataset - answer generated by GPT-4 (33k samples)
 ## Training procedure

 - High-quality reasoning dataset from private documents, QAs generated by Claude AI (1.3k samples)
 - EverythingLM-v2 (0.9k samples)
 - KoCoT (2k samples)
+- Private MRC dataset - answer generated by GPT-4 (32k samples)
+Original data have ~12k question-answer pairs with context, and augmentation is applied to make 20k samples with triplet contexts case (1 correct context out of 3)
 ## Training procedure