RichardErkhov
/

amang1802_-_Llama3.2-1B-summary-length-exp7-awq

4-bit precision

Model card Files Files and versions Community

RichardErkhov commited on 7 days ago

Commit

76369b4

•

1 Parent(s): 01e756b

uploaded readme

Files changed (1) hide show

README.md +36 -0

README.md ADDED Viewed

	@@ -0,0 +1,36 @@

+Quantization made by Richard Erkhov.
+[Github](https://github.com/RichardErkhov)
+[Discord](https://discord.gg/pvy7H8DZMG)
+[Request more models](https://github.com/RichardErkhov/quant_request)
+Llama3.2-1B-summary-length-exp7 - AWQ
+- Model creator: https://huggingface.co/amang1802/
+- Original model: https://huggingface.co/amang1802/Llama3.2-1B-summary-length-exp7/
+Original model description:
+---
+library_name: transformers
+tags: []
+---
+# Model Card for Model ID
+- Summary Length PPO experiment #7
+- No KL divergence in loss
+## Model Details
+- Dataset size: 16384
+- Epochs: 1
+- Batch Size: 16 * 4 (w/ 4 GPUs)
+Optimizer args: Torch AdamW default, except
+- LR = 0.00001