shuyuej
/

Meta-Llama-3-8B-Instruct-GPTQ

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

shuyuej commited on Jul 22

Commit

a049b21

•

1 Parent(s): 1d24ce0

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -7,7 +7,7 @@ license: apache-2.0
 Original Base Model: `meta-llama/Meta-Llama-3-8B-Instruct`.<br>
 Link: [https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct)
-Quantization Configurations:
 ```
 "quantization_config": {
     "batch_size": 1,
@@ -34,3 +34,6 @@ Quantization Configurations:
     "use_exllama": true
   },
 ```

 Original Base Model: `meta-llama/Meta-Llama-3-8B-Instruct`.<br>
 Link: [https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct)
+## Quantization Configurations
 ```
 "quantization_config": {
     "batch_size": 1,
     "use_exllama": true
   },
 ```
+## Source Codes
+Source Codes: [https://github.com/vkola-lab/medpodgpt/tree/main/quantization](https://github.com/vkola-lab/medpodgpt/tree/main/quantization).