qingy2024
/

QwQ-14B-Math-v0.2

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qingy2024 commited on 6 days ago

Commit

308f732

•

1 Parent(s): 47bab4c

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -31,7 +31,7 @@ At 500 steps, the loss was plateauing so I decided to stop training to prevent e
 #### Training Details
 - **Base Model**: Qwen 2.5-14B
-- **Fine-Tuning Dataset**: Verified subset of **NuminaMathCoT** using Qwen 2.5 3B Instruct as a judge.
 - **QLoRA Configuration**:
   - **Rank**: 32
   - **Rank Stabilization**: Enabled

 #### Training Details
 - **Base Model**: Qwen 2.5-14B
+- **Fine-Tuning Dataset**: Verified subset of **NuminaMathCoT** using Qwen 2.5 3B Instruct as a judge. (the `sharegpt-verified-cleaned` subset from my dataset).
 - **QLoRA Configuration**:
   - **Rank**: 32
   - **Rank Stabilization**: Enabled