Upload folder using huggingface_hub (#6)

Browse files

- 6034f36849f9adbc0f206e478ad13022e246443202df6955cc1d824a482c4883 (fe5002a478bd2db79e4a08bc0b495dd22c31a66d)

Files changed (4) hide show

README.md +5 -5
config.json +26 -26
model.safetensors +1 -1
smash_config.json +1 -1

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 thumbnail: "https://assets-global.website-files.com/646b351987a8d8ce158d1940/64ec9e96b4334c0e1ac41504_Logo%20with%20white%20text.svg"
-base_model: ORIGINAL_REPO_NAME
 metrics:
 - memory_disk
 - memory_inference
@@ -52,7 +52,7 @@ tags:
 You can run the smashed model with these steps:
-0. Check requirements from the original repo ORIGINAL_REPO_NAME installed. In particular, check python, cuda, and transformers versions.
 1. Make sure that you have installed quantization related packages.
     ```bash
     pip install transformers accelerate bitsandbytes>0.37.0
@@ -63,7 +63,7 @@ You can run the smashed model with these steps:
    model = AutoModelForCausalLM.from_pretrained("PrunaAI/distributed-optimized-gpt2-1b-bnb-8bit-smashed", trust_remote_code=True, device_map='auto')
-   tokenizer = AutoTokenizer.from_pretrained("ORIGINAL_REPO_NAME")
    input_ids = tokenizer("What is the color of prunes?,", return_tensors='pt').to(model.device)["input_ids"]
@@ -77,9 +77,9 @@ The configuration info are in `smash_config.json`.
 ## Credits & License
-The license of the smashed model follows the license of the original model. Please check the license of the original model ORIGINAL_REPO_NAME before using this model which provided the base model. The license  of the `pruna-engine` is [here](https://pypi.org/project/pruna-engine/) on Pypi.
 ## Want to compress other models?
 - Contact us and tell us which model to compress next [here](https://www.pruna.ai/contact).
-- Request access to easily compress your own AI models [here](https://z0halsaff74.typeform.com/pruna-access?typeform-source=www.pruna.ai).

 ---
 thumbnail: "https://assets-global.website-files.com/646b351987a8d8ce158d1940/64ec9e96b4334c0e1ac41504_Logo%20with%20white%20text.svg"
+base_model: distributed/optimized-gpt2-1b
 metrics:
 - memory_disk
 - memory_inference
 You can run the smashed model with these steps:
+0. Check requirements from the original repo distributed/optimized-gpt2-1b installed. In particular, check python, cuda, and transformers versions.
 1. Make sure that you have installed quantization related packages.
     ```bash
     pip install transformers accelerate bitsandbytes>0.37.0
    model = AutoModelForCausalLM.from_pretrained("PrunaAI/distributed-optimized-gpt2-1b-bnb-8bit-smashed", trust_remote_code=True, device_map='auto')
+   tokenizer = AutoTokenizer.from_pretrained("distributed/optimized-gpt2-1b")
    input_ids = tokenizer("What is the color of prunes?,", return_tensors='pt').to(model.device)["input_ids"]
 ## Credits & License
+The license of the smashed model follows the license of the original model. Please check the license of the original model distributed/optimized-gpt2-1b before using this model which provided the base model. The license  of the `pruna-engine` is [here](https://pypi.org/project/pruna-engine/) on Pypi.
 ## Want to compress other models?
 - Contact us and tell us which model to compress next [here](https://www.pruna.ai/contact).
+- Do it by yourself [here](https://docs.pruna.ai/en/latest/setup/pip.html).

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-    "_name_or_path": "/covalent/.cache/models/tmpkxfo3h1v7mopnxe4",
     "activation_function": "gelu_new",
     "all_reduce_scores": {
         "0": "NON_PARTICIPATING",
@@ -26,7 +26,7 @@
         "117": "NON_PARTICIPATING",
         "118": "NON_PARTICIPATING",
         "119": "NON_PARTICIPATING",
-        "12": "SUCCESS",
         "120": "NON_PARTICIPATING",
         "121": "NON_PARTICIPATING",
         "122": "NON_PARTICIPATING",
@@ -36,7 +36,7 @@
         "126": "NON_PARTICIPATING",
         "127": "NON_PARTICIPATING",
         "128": "NON_PARTICIPATING",
-        "129": "SUCCESS",
         "13": "NON_PARTICIPATING",
         "130": "NON_PARTICIPATING",
         "131": "NON_PARTICIPATING",
@@ -49,9 +49,9 @@
         "138": "NON_PARTICIPATING",
         "139": "NON_PARTICIPATING",
         "14": "NON_PARTICIPATING",
-        "140": "SUCCESS",
-        "141": "NON_PARTICIPATING",
-        "142": "SUCCESS",
         "143": "SUCCESS",
         "144": "NON_PARTICIPATING",
         "145": "NON_PARTICIPATING",
@@ -61,15 +61,15 @@
         "149": "NON_PARTICIPATING",
         "15": "NON_PARTICIPATING",
         "150": "NON_PARTICIPATING",
-        "151": "SUCCESS",
         "152": "NON_PARTICIPATING",
         "153": "NON_PARTICIPATING",
         "154": "NON_PARTICIPATING",
         "155": "NON_PARTICIPATING",
-        "156": "NON_PARTICIPATING",
         "157": "NON_PARTICIPATING",
         "158": "NON_PARTICIPATING",
-        "159": "SUCCESS",
         "16": "NON_PARTICIPATING",
         "160": "NON_PARTICIPATING",
         "161": "NON_PARTICIPATING",
@@ -80,7 +80,7 @@
         "166": "NON_PARTICIPATING",
         "167": "NON_PARTICIPATING",
         "168": "NON_PARTICIPATING",
-        "169": "NON_PARTICIPATING",
         "17": "NON_PARTICIPATING",
         "170": "NON_PARTICIPATING",
         "171": "NON_PARTICIPATING",
@@ -90,8 +90,8 @@
         "175": "NON_PARTICIPATING",
         "176": "NON_PARTICIPATING",
         "177": "NON_PARTICIPATING",
-        "178": "SUCCESS",
-        "179": "NON_PARTICIPATING",
         "18": "NON_PARTICIPATING",
         "180": "NON_PARTICIPATING",
         "181": "NON_PARTICIPATING",
@@ -114,7 +114,7 @@
         "197": "NON_PARTICIPATING",
         "198": "NON_PARTICIPATING",
         "199": "NON_PARTICIPATING",
-        "2": "NON_PARTICIPATING",
         "20": "NON_PARTICIPATING",
         "200": "NON_PARTICIPATING",
         "201": "NON_PARTICIPATING",
@@ -130,7 +130,7 @@
         "210": "NON_PARTICIPATING",
         "211": "NON_PARTICIPATING",
         "212": "NON_PARTICIPATING",
-        "213": "NON_PARTICIPATING",
         "214": "NON_PARTICIPATING",
         "215": "NON_PARTICIPATING",
         "216": "SUCCESS",
@@ -179,7 +179,7 @@
         "255": "NON_PARTICIPATING",
         "26": "NON_PARTICIPATING",
         "27": "NON_PARTICIPATING",
-        "28": "NON_PARTICIPATING",
         "29": "NON_PARTICIPATING",
         "3": "NON_PARTICIPATING",
         "30": "NON_PARTICIPATING",
@@ -206,7 +206,7 @@
         "5": "NON_PARTICIPATING",
         "50": "NON_PARTICIPATING",
         "51": "NON_PARTICIPATING",
-        "52": "NON_PARTICIPATING",
         "53": "NON_PARTICIPATING",
         "54": "NON_PARTICIPATING",
         "55": "NON_PARTICIPATING",
@@ -222,41 +222,41 @@
         "64": "NON_PARTICIPATING",
         "65": "NON_PARTICIPATING",
         "66": "NON_PARTICIPATING",
-        "67": "SUCCESS",
         "68": "NON_PARTICIPATING",
         "69": "NON_PARTICIPATING",
         "7": "SUCCESS",
         "70": "NON_PARTICIPATING",
         "71": "NON_PARTICIPATING",
         "72": "NON_PARTICIPATING",
-        "73": "SUCCESS",
-        "74": "NON_PARTICIPATING",
-        "75": "SUCCESS",
         "76": "NON_PARTICIPATING",
         "77": "NON_PARTICIPATING",
-        "78": "SUCCESS",
         "79": "NON_PARTICIPATING",
         "8": "NON_PARTICIPATING",
         "80": "NON_PARTICIPATING",
         "81": "NON_PARTICIPATING",
         "82": "NON_PARTICIPATING",
         "83": "NON_PARTICIPATING",
-        "84": "SUCCESS",
         "85": "NON_PARTICIPATING",
-        "86": "SUCCESS",
         "87": "NON_PARTICIPATING",
-        "88": "NON_PARTICIPATING",
         "89": "NON_PARTICIPATING",
         "9": "NON_PARTICIPATING",
         "90": "NON_PARTICIPATING",
         "91": "NON_PARTICIPATING",
         "92": "NON_PARTICIPATING",
         "93": "NON_PARTICIPATING",
-        "94": "SUCCESS",
         "95": "SUCCESS",
         "96": "NON_PARTICIPATING",
         "97": "NON_PARTICIPATING",
-        "98": "SUCCESS",
         "99": "NON_PARTICIPATING"
     },
     "architectures": [

 {
+    "_name_or_path": "/covalent/.cache/models/tmpg_8jo7a30wplyaho",
     "activation_function": "gelu_new",
     "all_reduce_scores": {
         "0": "NON_PARTICIPATING",
         "117": "NON_PARTICIPATING",
         "118": "NON_PARTICIPATING",
         "119": "NON_PARTICIPATING",
+        "12": "NON_PARTICIPATING",
         "120": "NON_PARTICIPATING",
         "121": "NON_PARTICIPATING",
         "122": "NON_PARTICIPATING",
         "126": "NON_PARTICIPATING",
         "127": "NON_PARTICIPATING",
         "128": "NON_PARTICIPATING",
+        "129": "NON_PARTICIPATING",
         "13": "NON_PARTICIPATING",
         "130": "NON_PARTICIPATING",
         "131": "NON_PARTICIPATING",
         "138": "NON_PARTICIPATING",
         "139": "NON_PARTICIPATING",
         "14": "NON_PARTICIPATING",
+        "140": "NON_PARTICIPATING",
+        "141": "SUCCESS",
+        "142": "NON_PARTICIPATING",
         "143": "SUCCESS",
         "144": "NON_PARTICIPATING",
         "145": "NON_PARTICIPATING",
         "149": "NON_PARTICIPATING",
         "15": "NON_PARTICIPATING",
         "150": "NON_PARTICIPATING",
+        "151": "NON_PARTICIPATING",
         "152": "NON_PARTICIPATING",
         "153": "NON_PARTICIPATING",
         "154": "NON_PARTICIPATING",
         "155": "NON_PARTICIPATING",
+        "156": "SUCCESS",
         "157": "NON_PARTICIPATING",
         "158": "NON_PARTICIPATING",
+        "159": "NON_PARTICIPATING",
         "16": "NON_PARTICIPATING",
         "160": "NON_PARTICIPATING",
         "161": "NON_PARTICIPATING",
         "166": "NON_PARTICIPATING",
         "167": "NON_PARTICIPATING",
         "168": "NON_PARTICIPATING",
+        "169": "SUCCESS",
         "17": "NON_PARTICIPATING",
         "170": "NON_PARTICIPATING",
         "171": "NON_PARTICIPATING",
         "175": "NON_PARTICIPATING",
         "176": "NON_PARTICIPATING",
         "177": "NON_PARTICIPATING",
+        "178": "NON_PARTICIPATING",
+        "179": "SUCCESS",
         "18": "NON_PARTICIPATING",
         "180": "NON_PARTICIPATING",
         "181": "NON_PARTICIPATING",
         "197": "NON_PARTICIPATING",
         "198": "NON_PARTICIPATING",
         "199": "NON_PARTICIPATING",
+        "2": "SUCCESS",
         "20": "NON_PARTICIPATING",
         "200": "NON_PARTICIPATING",
         "201": "NON_PARTICIPATING",
         "210": "NON_PARTICIPATING",
         "211": "NON_PARTICIPATING",
         "212": "NON_PARTICIPATING",
+        "213": "SUCCESS",
         "214": "NON_PARTICIPATING",
         "215": "NON_PARTICIPATING",
         "216": "SUCCESS",
         "255": "NON_PARTICIPATING",
         "26": "NON_PARTICIPATING",
         "27": "NON_PARTICIPATING",
+        "28": "SUCCESS",
         "29": "NON_PARTICIPATING",
         "3": "NON_PARTICIPATING",
         "30": "NON_PARTICIPATING",
         "5": "NON_PARTICIPATING",
         "50": "NON_PARTICIPATING",
         "51": "NON_PARTICIPATING",
+        "52": "SUCCESS",
         "53": "NON_PARTICIPATING",
         "54": "NON_PARTICIPATING",
         "55": "NON_PARTICIPATING",
         "64": "NON_PARTICIPATING",
         "65": "NON_PARTICIPATING",
         "66": "NON_PARTICIPATING",
+        "67": "NON_PARTICIPATING",
         "68": "NON_PARTICIPATING",
         "69": "NON_PARTICIPATING",
         "7": "SUCCESS",
         "70": "NON_PARTICIPATING",
         "71": "NON_PARTICIPATING",
         "72": "NON_PARTICIPATING",
+        "73": "NON_PARTICIPATING",
+        "74": "SUCCESS",
+        "75": "NON_PARTICIPATING",
         "76": "NON_PARTICIPATING",
         "77": "NON_PARTICIPATING",
+        "78": "NON_PARTICIPATING",
         "79": "NON_PARTICIPATING",
         "8": "NON_PARTICIPATING",
         "80": "NON_PARTICIPATING",
         "81": "NON_PARTICIPATING",
         "82": "NON_PARTICIPATING",
         "83": "NON_PARTICIPATING",
+        "84": "NON_PARTICIPATING",
         "85": "NON_PARTICIPATING",
+        "86": "NON_PARTICIPATING",
         "87": "NON_PARTICIPATING",
+        "88": "SUCCESS",
         "89": "NON_PARTICIPATING",
         "9": "NON_PARTICIPATING",
         "90": "NON_PARTICIPATING",
         "91": "NON_PARTICIPATING",
         "92": "NON_PARTICIPATING",
         "93": "NON_PARTICIPATING",
+        "94": "NON_PARTICIPATING",
         "95": "SUCCESS",
         "96": "NON_PARTICIPATING",
         "97": "NON_PARTICIPATING",
+        "98": "NON_PARTICIPATING",
         "99": "NON_PARTICIPATING"
     },
     "architectures": [

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0236a2cb311792dbd6afc14acb974ea097a423a771a763387ad90c1ca5569562
 size 1207575528

 version https://git-lfs.github.com/spec/v1
+oid sha256:129bac3621dfd112f94500629cc35d3df6c1e4c645ac42707f058a2e8d7f789d
 size 1207575528

smash_config.json CHANGED Viewed

@@ -28,7 +28,7 @@
     "quant_llm-int8_weight_bits": 8,
     "max_batch_size": 1,
     "device": "cuda",
-    "cache_dir": "/covalent/.cache/models/tmpkxfo3h1v",
     "task": "",
     "save_load_fn": "bitsandbytes",
     "save_load_fn_args": {}

     "quant_llm-int8_weight_bits": 8,
     "max_batch_size": 1,
     "device": "cuda",
+    "cache_dir": "/covalent/.cache/models/tmpg_8jo7a3",
     "task": "",
     "save_load_fn": "bitsandbytes",
     "save_load_fn_args": {}