RichardErkhov
/

amang1802_-_Llama3.2-1B-summary-length-exp7-awq

4-bit precision

Model card Files Files and versions Community

amang1802_-_Llama3.2-1B-summary-length-exp7-awq / README.md

RichardErkhov's picture

uploaded readme

76369b4 verified 21 days ago

|

history blame contribute delete

682 Bytes

Quantization made by Richard Erkhov.

Request more models

Llama3.2-1B-summary-length-exp7 - AWQ

Model creator: https://huggingface.co/amang1802/
Original model: https://huggingface.co/amang1802/Llama3.2-1B-summary-length-exp7/

Original model description:

library_name: transformers tags: []

Model Card for Model ID

Summary Length PPO experiment #7
No KL divergence in loss

Model Details

Dataset size: 16384
Epochs: 1
Batch Size: 16 * 4 (w/ 4 GPUs)

Optimizer args: Torch AdamW default, except

LR = 0.00001