AhmedBou
/

databricks-dolly-v2-3b_statistical_procedures

Inference Endpoints

Model card Files Files and versions Community

AhmedBou commited on Jun 5, 2023

Commit

f56ac71

•

1 Parent(s): 10ea185

Update README.md

Files changed (1) hide show

README.md +13 -7

README.md CHANGED Viewed

@@ -26,7 +26,7 @@ Import this model using:
 <span style="color: #0000FF;">from</span> peft <span style="color: #0000FF;">import</span> PeftModel, PeftConfig
 <span style="color: #0000FF;">from</span> transformers <span style="color: #0000FF;">import</span> AutoModelForCausalLM, AutoTokenizer
-peft_model_id = "<span style="color: #A31515;">"AhmedBou/databricks-dolly-v2-3b_on_NCSS"</span>
 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, return_dict=<span style="color: #0000FF;">True</span>, load_in_8bit=<span style="color: #0000FF;">True</span>, device_map=<span style="color: #0000FF;">'auto'</span>)
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
@@ -40,16 +40,22 @@ model = PeftModel.from_pretrained(model, peft_model_id)
 Inference using:
 <pre>
-batch = tokenizer("“Multiple Regression for Appraisal” -->: ", return_tensors='pt')
-with torch.cuda.amp.autocast():
-output_tokens = model.generate(**batch, max_new_tokens=50)
-print('\n\n', tokenizer.decode(output_tokens[0], skip_special_tokens=True))
 </pre>
 Output:
 <pre>
-“Multiple Regression for Appraisal” -->: Multiple Regression for Appraisal (MRA) -->: Multiple Regression for Appraisal (MRA) (with Covariates) -->: Multiple Regression for Appraisal (MRA) (with Covariates
-</pre>

 <span style="color: #0000FF;">from</span> peft <span style="color: #0000FF;">import</span> PeftModel, PeftConfig
 <span style="color: #0000FF;">from</span> transformers <span style="color: #0000FF;">import</span> AutoModelForCausalLM, AutoTokenizer
+peft_model_id = "<span style="color: #A31515;">AhmedBou/databricks-dolly-v2-3b_on_NCSS"</span>
 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, return_dict=<span style="color: #0000FF;">True</span>, load_in_8bit=<span style="color: #0000FF;">True</span>, device_map=<span style="color: #0000FF;">'auto'</span>)
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
 Inference using:
 <pre>
+<code>
+<span style="color: #0000FF;">batch</span> = tokenizer("“Multiple Regression for Appraisal” --&gt;: ", return_tensors=<span style="color: #A31515;">'pt'</span>)
+<span style="color: #0000FF;">with</span> torch.cuda.amp.autocast():
+    output_tokens = model.generate(**batch, max_new_tokens=<span style="color: #098658;">50</span>)
+<span style="color: #0000FF;">print</span>('
+', tokenizer.decode(output_tokens[<span style="color: #098658;">0</span>], skip_special_tokens=<span style="color: #0000FF;">True</span>))
+</code>
 </pre>
 Output:
 <pre>
+<code>
+“Multiple Regression for Appraisal” --&gt;: Multiple Regression for Appraisal (MRA) --&gt;: Multiple Regression for Appraisal (MRA) (with Covariates) --&gt;: Multiple Regression for Appraisal (MRA) (with Covariates)
+</code>
+</pre>