pszemraj
/

stablelm-4e1t-2b-v0.1

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pszemraj commited on May 20

Commit

7d50bcf

•

1 Parent(s): cde0db1

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -12,9 +12,9 @@ model-index:
 # stablelm-4e1t-2b-v0.1
-This is a layer pruning experiment based off of the original llama-3-8b:
-- 8 layers pruned with [PruneMe](https://github.com/pszemraj/PruneMe/tree/upgrades)/MergeKit
   - layers selected using [BEE-spoke-data/fineweb-100k_en-med](https://hf.co/datasets/BEE-spoke-data/fineweb-100k_en-med)
 - brief subsequent continued pretraining @ ctx 4096
   - data: 10k rows of FineWeb (different than pruning data) + some curated data

 # stablelm-4e1t-2b-v0.1
+This is a layer pruning experiment based off of [stablelm-3b-4e1t](https://huggingface.co/stabilityai/stablelm-3b-4e1t):
+- 10 layers pruned with [PruneMe](https://github.com/pszemraj/PruneMe/tree/upgrades)/MergeKit
   - layers selected using [BEE-spoke-data/fineweb-100k_en-med](https://hf.co/datasets/BEE-spoke-data/fineweb-100k_en-med)
 - brief subsequent continued pretraining @ ctx 4096
   - data: 10k rows of FineWeb (different than pruning data) + some curated data