File size: 502 Bytes
9139726
 
 
 
 
 
 
 
 
 
fe121ef
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
---
license: apache-2.0
datasets:
- HuggingFaceFW/fineweb
- llm-book/llm-jp-eval
language:
- ja
- en
base_model:
- state-spaces/mamba-1.4b
---

## Descriptions

SSMモデルにより、LLMの厳しいハードウェア要求を引き下げることを目的にトレーニングしたモデル。
特に日本語への応答を滑らかにすることが主眼。

## Result

モデルサイズのためか、学習ステップ数のためかあまりよい応答を返すようにならなかった。