File size: 502 Bytes
9139726 fe121ef |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
---
license: apache-2.0
datasets:
- HuggingFaceFW/fineweb
- llm-book/llm-jp-eval
language:
- ja
- en
base_model:
- state-spaces/mamba-1.4b
---
## Descriptions
SSMモデルにより、LLMの厳しいハードウェア要求を引き下げることを目的にトレーニングしたモデル。
特に日本語への応答を滑らかにすることが主眼。
## Result
モデルサイズのためか、学習ステップ数のためかあまりよい応答を返すようにならなかった。 |