janhq
/

tinyllama

jan-hq commited on May 15

Commit

8694241

•

1 Parent(s): 8f24fd0

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -13,6 +13,7 @@ cortex engines
 ```
 Start model
 ```
 cortex models start tinyllama
 ```
@@ -28,7 +29,10 @@ Model Structure
 1.1b-chat-v1.0-gguf-Q4_K_M
 1.1b-chat-v1.0-gguf-Q6_K
 1.1b-chat-v1.0-gguf-Q8_0
-1.1b-chat-v1.0-tensorrtllm-ada_windows
-1.1b-chat-v1.0-tensorrtllm-turing_windows
-1.1b-chat-v1.0-tensorrtllm-ampere_windows
 ```

 ```
 Start model
 ```
 cortex models start tinyllama
 ```
 1.1b-chat-v1.0-gguf-Q4_K_M
 1.1b-chat-v1.0-gguf-Q6_K
 1.1b-chat-v1.0-gguf-Q8_0
+1.1b-chat-v1.0-tensorrtllm-ada_windows-int4
+1.1b-chat-v1.0-tensorrtllm-turing_windows-int4
+1.1b-chat-v1.0-tensorrtllm-ampere_windows-int4
+1.1b-chat-v1.0-tensorrtllm-ada_windows-fp16
+1.1b-chat-v1.0-tensorrtllm-turing_windows-fp16
+1.1b-chat-v1.0-tensorrtllm-ampere_windows-fp16
 ```