Update README.md
Browse files
README.md
CHANGED
@@ -10,6 +10,7 @@ Llama-2-ko-7V-chat-ggml ์ [beomi/llama-2-ko-7b](https://huggingface.co/beomi/l
|
|
10 |
|
11 |
- Llama2 tokenizer ์ [kfkas/Llama-2-ko-7b-Chat](https://huggingface.co/kfkas/Llama-2-ko-7b-Chat) ์์ ์ฌ์ฉ๋ ํ๊ตญ์ด Additaional Token ์ ๋ฐ์ํ์ฌ ์์ฑํ์ต๋๋ค.
|
12 |
- **GGML** ํฌ๋งท ๋ชจ๋ธ์ [llama.cpp](https://github.com/ggerganov/llama.cpp) ๋ฅผ ์ฌ์ฉํ์ฌ C/C++ ๊ธฐ๋ฐ์ผ๋ก Inference ํฉ๋๋ค.
|
|
|
13 |
- [llama.cpp](https://github.com/ggerganov/llama.cpp) ์ Python Binding ํจํค์ง์ธ [llama-cpp-python](https://github.com/abetlen/llama-cpp-python) ์ ์ฌ์ฉํ๋ฉด python ํ๊ฒฝ์์๋ Inference ๊ฐ๋ฅํฉ๋๋ค.
|
14 |
|
15 |
์ฐธ๊ณ ๋ก, [Llama-2-ko-7B-ggml](https://huggingface.co/StarFox7/Llama-2-ko-7B-ggml) ์์ [Llama-2-ko-7b-chat](https://huggingface.co/kfkas/Llama-2-ko-7b-Chat) ์ ๋ฒ ์ด์ค๋ชจ๋ธ์ธ [beomi/llama-2-ko-7b](https://huggingface.co/beomi/llama-2-ko-7b) ์ **GGML** ํฌ๋งท ๋ชจ๋ธ์ ์ฐพ์ ์ ์์ต๋๋ค.
|
|
|
10 |
|
11 |
- Llama2 tokenizer ์ [kfkas/Llama-2-ko-7b-Chat](https://huggingface.co/kfkas/Llama-2-ko-7b-Chat) ์์ ์ฌ์ฉ๋ ํ๊ตญ์ด Additaional Token ์ ๋ฐ์ํ์ฌ ์์ฑํ์ต๋๋ค.
|
12 |
- **GGML** ํฌ๋งท ๋ชจ๋ธ์ [llama.cpp](https://github.com/ggerganov/llama.cpp) ๋ฅผ ์ฌ์ฉํ์ฌ C/C++ ๊ธฐ๋ฐ์ผ๋ก Inference ํฉ๋๋ค.
|
13 |
+
- **GGML** ํฌ๋งท ๋ชจ๋ธ์ ๋น๊ต์ ๋ฎ์ ์ฌ์์ ์ปดํจํ
์์์์๋ Inference ๊ฐ๋ฅํฉ๋๋ค. ( ์: 4๋นํธ ์์ํ ๋ชจ๋ธ (q4) ์ CPU,7-8GB RAM ํ๊ฒฝ์์ Inference ๊ฐ๋ฅ )
|
14 |
- [llama.cpp](https://github.com/ggerganov/llama.cpp) ์ Python Binding ํจํค์ง์ธ [llama-cpp-python](https://github.com/abetlen/llama-cpp-python) ์ ์ฌ์ฉํ๋ฉด python ํ๊ฒฝ์์๋ Inference ๊ฐ๋ฅํฉ๋๋ค.
|
15 |
|
16 |
์ฐธ๊ณ ๋ก, [Llama-2-ko-7B-ggml](https://huggingface.co/StarFox7/Llama-2-ko-7B-ggml) ์์ [Llama-2-ko-7b-chat](https://huggingface.co/kfkas/Llama-2-ko-7b-Chat) ์ ๋ฒ ์ด์ค๋ชจ๋ธ์ธ [beomi/llama-2-ko-7b](https://huggingface.co/beomi/llama-2-ko-7b) ์ **GGML** ํฌ๋งท ๋ชจ๋ธ์ ์ฐพ์ ์ ์์ต๋๋ค.
|