What is this?

LG AI Researchの韓国語-英語バイリンガル言語モデルEXAONE-3.5-32B-Instructを日本語imatrixで量子化したものです。
なお、商用利用はできませんのでご注意ください。

imatrix dataset

日本語能力を重視し、日本語が多量に含まれるTFMC/imatrix-dataset-for-japanese-llmデータセットを使用しました。
公式配布されているBF16版GGUFを利用しましたが、途中、計算リソースの関係上imatrixの算出においてはQ8_0量子化モデルを使用しました。

Chat template

[|system|]ここにsystemプロンプトを書きます[|endofturn|]
[|user|]ここにMessageを書きます
[|assistant|]

Environment

Windows(CUDA12)版llama.cpp-b4178を使用して量子化作業を実施しました。

License

EXAONE AI Model License Agreement 1.1 - NC

Developer

LG AI Research

Downloads last month
27
GGUF
Model size
32B params
Architecture
exaone

4-bit

Inference API
Unable to determine this model's library. Check the docs .