grapevine-AI
commited on
Update README.md
Browse files
README.md
CHANGED
@@ -1,5 +1,31 @@
|
|
1 |
-
---
|
2 |
-
license: other
|
3 |
-
|
4 |
-
|
5 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
license: other
|
3 |
+
---
|
4 |
+
# What is this?
|
5 |
+
NexusflowのAthene-70Bの次世代モデル[Athene-V2-Chat](https://huggingface.co/Nexusflow/Athene-V2-Chat)を日本語imatrixで量子化したものです。<br>
|
6 |
+
今回からはQwen2.5-72B-Instructベースに切り替わり、Chat用モデルとAgent用モデルの2種類が用意されるようになりました。<br>
|
7 |
+
なお、**商用利用はできません**のでご注意ください。
|
8 |
+
|
9 |
+
# imatrix dataset
|
10 |
+
日本語能力を重視し、日本語が多量に含まれる[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)データセットを使用しました。<br>
|
11 |
+
なお、計算リソースの関係上imatrixの算出においてはQ8_0量子化モデルを使用しました。
|
12 |
+
|
13 |
+
# Chat template
|
14 |
+
```
|
15 |
+
<|im_start|>system
|
16 |
+
ここにSystem Promptを書きます。<|im_end|>
|
17 |
+
<|im_start|>user
|
18 |
+
ここにMessageを書きます。<|im_end|>
|
19 |
+
<|im_start|>assistant
|
20 |
+
|
21 |
+
|
22 |
+
```
|
23 |
+
|
24 |
+
# Environment
|
25 |
+
Windows版llama.cpp-b3621およびllama.cpp-b3472同時リリースのconvert-hf-to-gguf.pyを使用して量子化作業を実施しました。
|
26 |
+
|
27 |
+
# License
|
28 |
+
Qwen LICENSE & Nexusflow Research License
|
29 |
+
|
30 |
+
# Developer
|
31 |
+
Alibaba Cloud & Nexusflow
|