alpindale
/

Llama-2-13b-ONNX

Text Generation

text generation

Model card Files Files and versions Community

alpindale commited on Sep 22, 2023

Commit

0f877eb

·

1 Parent(s): a3b722c

Update ChatApp/app.py

Files changed (1) hide show

ChatApp/app.py +17 -1

ChatApp/app.py CHANGED Viewed

@@ -33,6 +33,22 @@ top_directory = os.path.dirname(os.path.dirname(os.path.realpath(__file__)))
 tokenizer_path = os.path.join(top_directory, "tokenizer.model")
 available_models = {
     "Llama-2 13B Float16": {
         "onnx_file": os.path.join(
             top_directory, "FP16", "LlamaV2_13B_float16.onnx"
@@ -40,7 +56,7 @@ available_models = {
         "tokenizer_path": tokenizer_path,
         "embedding_file": os.path.join(top_directory, "embeddings.pth"),
     },
-    "Llama-2 13B FP32": {
         "onnx_file": os.path.join(
             top_directory, "FP32", "LlamaV2_13B_float16.onnx"
         ),

 tokenizer_path = os.path.join(top_directory, "tokenizer.model")
 available_models = {
+    "Llama-2 Chat 13B Float16": {
+        "onnx_file": os.path.join(
+            top_directory, "FP16-Chat", "LlamaV2_13B_FT_float32.onnx"
+        ),
+        "tokenizer_path": tokenizer_path,
+        "embedding_file": os.path.join(top_directory, "embeddings-chat.pth"),
+    },
+    "Llama-2 Chat 13B Float32": {
+        "onnx_file": os.path.join(
+            top_directory, "FP32-Chat", "LlamaV2_13B_FT_float32.onnx"
+        ),
+        "tokenizer_path": tokenizer_path,
+        "embedding_file": os.path.join(
+            top_directory, "embeddings-chat.pth"
+        ),
+    },
     "Llama-2 13B Float16": {
         "onnx_file": os.path.join(
             top_directory, "FP16", "LlamaV2_13B_float16.onnx"
         "tokenizer_path": tokenizer_path,
         "embedding_file": os.path.join(top_directory, "embeddings.pth"),
     },
+    "Llama-2 13B Float32": {
         "onnx_file": os.path.join(
             top_directory, "FP32", "LlamaV2_13B_float16.onnx"
         ),