keitokei1994
/

Llama-3-8B-shisa-2x8B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

keitokei1994 commited on May 26

Commit

1ea96eb

•

1 Parent(s): c0065e6

Update README.md

Files changed (1) hide show

README.md +2 -6

README.md CHANGED Viewed

@@ -9,16 +9,12 @@ language:
 このモデルは、MergeKitツールを使用して作成されたMixture of Experts (MoE) 言語モデルです。
-元のmeta-llama/Meta-Llama-3-8B-Instructに、日本語データセットでファインチューニングされたshisa-ai/shisa-v1-llama3-8を合わせることで、
-元のMeta-Llama-3-8B-Instructの能力を維持したまま、日本語能力を向上させようとしたモデルです。
 [Sdff-Ltba/LightChatAssistant-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-2x7B)と
 [Aratako/LightChatAssistant-4x7B](https://huggingface.co/Aratako/LightChatAssistant-4x7B)にインスパイアされて、Llama3でのMoEを始めています。お二人に感謝します。
-お二人が行なっているような、ファインチューニングモデルから取り出したchatvectorを加算し、MoEモデル化するアプローチも手元では行なっていますので、
-今後時間のある時にモデルのアップロードができたらと考えています。
 ### モデルの詳細

 このモデルは、MergeKitツールを使用して作成されたMixture of Experts (MoE) 言語モデルです。
+元のmeta-llama/Meta-Llama-3-8B-Instructに、日本語データセットでファインチューニングされたshisa-ai/shisa-v1-llama3-8を合わせることで、元のMeta-Llama-3-8B-Instructの能力を維持したまま、日本語能力を向上させようとしたモデルです。
 [Sdff-Ltba/LightChatAssistant-2x7B](https://huggingface.co/Sdff-Ltba/LightChatAssistant-2x7B)と
 [Aratako/LightChatAssistant-4x7B](https://huggingface.co/Aratako/LightChatAssistant-4x7B)にインスパイアされて、Llama3でのMoEを始めています。お二人に感謝します。
+お二人が行なっているような、ファインチューニングモデルから取り出したchatvectorを加算し、MoEモデル化するアプローチも手元では行なっていますので、今後時間のある時にモデルのアップロードができたらと考えています。
 ### モデルの詳細