aloobun
/

Meta-Llama-3-7B-28Layers

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

aloobun commited on May 10, 2024

Commit

9822e6b

·

verified ·

1 Parent(s): 7f4b284

Update README.md

Files changed (1) hide show

README.md +24 -10

README.md CHANGED Viewed

@@ -1,12 +1,26 @@
----
-base_model:
-- meta-llama/Meta-Llama-3-8B
-library_name: transformers
-tags:
-- mergekit
-- merge
----
 # model
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
@@ -37,4 +51,4 @@ slices:
 merge_method: passthrough
 dtype: bfloat16
-```

+---
+base_model:
+- meta-llama/Meta-Llama-3-8B
+library_name: transformers
+tags:
+- mergekit
+- merge
+- llama3
+license: llama3
+language:
+- en
+---
+Meta's Llama 3 8B pruned to 7B parameters(w/ 28 layers). Layers to prune selected using PruneMe repo on Github.
+- layers_to_skip = 4
+- Layer 23 to 27 has the minimum average distance of 0.18376044921875
+- [ ] To Do : Post pruning training.
+![layers](https://pbs.twimg.com/media/GNNMLD-XYAA1Opj?format=jpg&name=4096x4096)
 # model
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 merge_method: passthrough
 dtype: bfloat16
+```