ssuncheol
/

Phi-3-mini-128k-instruct-int4

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

ssuncheol commited on Apr 27

Commit

1a1008c

•

1 Parent(s): acf884a

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -7,7 +7,7 @@ language:
 - en
 ---
-# phi-3-mini-128k-instruct-int4
 - Orginal model : [microsoft/Phi-3-mini-128k-instruct](https://huggingface.co/microsoft/Phi-3-mini-128k-instruct)
 - Quantized using [intel/auto-round](https://github.com/intel/auto-round)
@@ -78,12 +78,12 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
 torch.random.manual_seed(0)
 model = AutoModelForCausalLM.from_pretrained(
-    "ssuncheol/phi-3-mini-128k-instruct-int4",
     device_map="cuda",
     torch_dtype="auto",
     trust_remote_code=True,
 )
-tokenizer = AutoTokenizer.from_pretrained("ssuncheol/phi-3-mini-128k-instruct-int4")
 messages = [
     {"role": "system", "content": "You are a helpful digital assistant. Please provide safe, ethical and accurate information to the user."},

 - en
 ---
+# Phi-3-mini-128k-instruct-int4
 - Orginal model : [microsoft/Phi-3-mini-128k-instruct](https://huggingface.co/microsoft/Phi-3-mini-128k-instruct)
 - Quantized using [intel/auto-round](https://github.com/intel/auto-round)
 torch.random.manual_seed(0)
 model = AutoModelForCausalLM.from_pretrained(
+    "ssuncheol/Phi-3-mini-128k-instruct-int4",
     device_map="cuda",
     torch_dtype="auto",
     trust_remote_code=True,
 )
+tokenizer = AutoTokenizer.from_pretrained("ssuncheol/Phi-3-mini-128k-instruct-int4")
 messages = [
     {"role": "system", "content": "You are a helpful digital assistant. Please provide safe, ethical and accurate information to the user."},