Spaces:

ngebodh
/

SimpleChatbot

Running

App Files Files Community

ngebodh commited on Jul 23, 2024

Commit

93447a2

verified ·

1 Parent(s): d879f4b

Llama 3.1 Serverless inference not available.

Browse files

Llama 3.1 Serverless inference not available.
Needs pro sub.

TODO: Fix with quantized version?

Error Message:
BadRequestError: Error code: 400 - {'error': 'Model requires a Pro subscription; check out hf.co/pricing to learn more. Make sure to include your HF token in your query.'}

Traceback:
File "/home/user/app/app.py", line 180, in <module>
stream = client.chat.completions.create(
File "/usr/local/lib/python3.10/site-packages/openai/_utils/_utils.py", line 277, in wrapper
return func(*args, **kwargs)
File "/usr/local/lib/python3.10/site-packages/openai/resources/chat/completions.py", line 646, in create
return self._post(
File "/usr/local/lib/python3.10/site-packages/openai/_base_client.py", line 1266, in post
return cast(ResponseT, self.request(cast_to, opts, stream=stream, stream_cls=stream_cls))
File "/usr/local/lib/python3.10/site-packages/openai/_base_client.py", line 942, in request
return self._request(
File "/usr/local/lib/python3.10/site-packages/openai/_base_client.py", line 1046, in _request
raise self._make_status_error_from_response(err.response) from None

Files changed (1) hide show

app.py +1 -1

app.py CHANGED Viewed

@@ -26,12 +26,12 @@ client = OpenAI(
 #Create supported models
 model_links ={
-    "Meta-Llama-3.1-8B":"meta-llama/Meta-Llama-3.1-8B-Instruct",
     "Meta-Llama-3-8B":"meta-llama/Meta-Llama-3-8B-Instruct",
     "Mistral-7B":"mistralai/Mistral-7B-Instruct-v0.2",
     "Gemma-7B":"google/gemma-1.1-7b-it",
     "Gemma-2B":"google/gemma-1.1-2b-it",
     "Zephyr-7B-β":"HuggingFaceH4/zephyr-7b-beta",
 }

 #Create supported models
 model_links ={
     "Meta-Llama-3-8B":"meta-llama/Meta-Llama-3-8B-Instruct",
     "Mistral-7B":"mistralai/Mistral-7B-Instruct-v0.2",
     "Gemma-7B":"google/gemma-1.1-7b-it",
     "Gemma-2B":"google/gemma-1.1-2b-it",
     "Zephyr-7B-β":"HuggingFaceH4/zephyr-7b-beta",
+    #"Meta-Llama-3.1-8B":"meta-llama/Meta-Llama-3.1-8B-Instruct", #TODO: Update when/if Serverless Inference available
 }