mmnga
/

stockmark-gpt-neox-japanese-1.4b-gguf

Inference Endpoints

Model card Files Files and versions Community

mmnga commited on Sep 7, 2023

Commit

13ea832

·

1 Parent(s): 8df4fa2

Update README.md

Files changed (1) hide show

README.md +9 -4

README.md CHANGED Viewed

@@ -8,14 +8,19 @@ tags:
 # stockmark-gpt-neox-japanese-1.4b-gguf
 [stockmarkさんが公開しているgpt-neox-japanese-1.4b](https://huggingface.co/stockmark/gpt-neox-japanese-1.4b)のggufフォーマット変換版です。
-llama.cppのexamplesで動かせます。
-*llama.cpp本家は開発速度が早く、clone先をブランチに変更しました。*
 ## Usage (試用)
 ```
 git clone --branch mmnga-dev https://github.com/mmnga/llama.cpp.git
 cd llama.cpp
-make -j gptneox
-./gptneox -m 'stockmark-gpt-neox-japanese-1.4b-q4_0.gguf' -n 128 -t 8 -p '吾輩って猫だったの！？'
 ```

 # stockmark-gpt-neox-japanese-1.4b-gguf
 [stockmarkさんが公開しているgpt-neox-japanese-1.4b](https://huggingface.co/stockmark/gpt-neox-japanese-1.4b)のggufフォーマット変換版です。
+注意:こちらはブランチで試用になります。llama.cpp本家にgptneoxが実装された時に、このggufファイルが使用できない可能性があります。
 ## Usage (試用)
 ```
 git clone --branch mmnga-dev https://github.com/mmnga/llama.cpp.git
 cd llama.cpp
+make -j
+./main -m 'stockmark-gpt-neox-japanese-1.4b-q4_0.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、'  --top_p 0.9 --temp 0.7 --repeat-penalty 1.1
+```
+**CUBLAS**
+```
+LLAMA_CUBLAS=1 make -j
+./main -m 'stockmark-gpt-neox-japanese-1.4b-q4_0.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、' -ngl 32
 ```