sbtom commited on
Commit
40bcf07
1 Parent(s): f3674b3

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +28 -0
README.md ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ja
4
+ pipeline_tag: text-generation
5
+ tags:
6
+ - merge
7
+ ---
8
+ # karakuri-MS-01.gguf
9
+ 以下のモデルを使用させていただいてます。(下つのモデルの詳細は後日中間モデルアップ後に行います)
10
+ - [karakuri-ai/karakuri-lm-70b-chat-v0.1(ベース)](https://huggingface.co/karakuri-ai/karakuri-lm-70b-chat-v0.1)
11
+ - [sbtom/karakuri-midrose-CV](https://huggingface.co/sbtom/karakuri-midrose-CV)
12
+ - karakuriとSOLARのChatVector
13
+ - karakuriとXwinのChatVector
14
+
15
+ ChatVectorとModel Stockの組み合わせは、相性が良いのではないかと思い、3つのChatVectorモデルをkarakuriをベースにしてModel Stockにてマージしました。<BR>
16
+ 少し検証したところ、各モデルのいいとこどりのような感想を持ちました。
17
+
18
+ ## モデル概要
19
+
20
+ これは日本語の特定の能力がmergeにより、どのように向上するかをテストするための実験モデルです。<BR>
21
+ koboldで検証する際は、Max Ctx. Tokensは4096以下、Amount to Genは512以下で使用することを推奨します。<BR>
22
+
23
+ ## ライセンス
24
+ merge元の各モデルのライセンスに従います。
25
+
26
+ ## 謝辞
27
+ [Model Stock](https://arxiv.org/abs/2403.19522)という新たな手法に感謝いたします。<BR>
28
+ マージに使用させていただいた、各モデルの作者様に感謝いたします。