Orion-14B
๐ค HuggingFaceํํ์ด์ง | ๐ค ModelScopeํํ์ด์ง
๐ฌ HuggingFace์จ๋ผ์ธ ์์ฉ | ๐ซ ModelScopeๅจ็บฟ่ฏ็จ
๐บ GitHub
๐ ๊ธฐ์ ๋ฆฌํฌํธ
๋ชฉ๋ก
- ๐ ๋ชจํ ์๊ฐ
- ๐ ๋ค์ด๋ก๋ ๊ฒฝ๋ก
- ๐ ํ๊ฐ๊ฒฐ๊ณผ
- ๐ ๋ชจํ ์ถ๋ฆฌ
- ๐ ์ฑ๋ช ํฉ์
- ๐ฅ ๊ธฐ์ ์๊ฐ
1. ๋ชจ๋ธ์๊ฒ
-Orion-14B-Base๋ 2.5์กฐ ํ ํฐ์ ๋ค์ํ ๋ฐ์ดํฐ ์งํฉ์ผ๋ก ํ๋ จ๋ 140์ต ๊ฐ์ ํ๋ผ๋ฉํฐ๋ฅผ ๊ฐ์ง ๋ค์ค ์ธ์ด ๋ชจ๋ธ์ด๋ค. ์ค๊ตญ์ด, ์์ด, ์ผ๋ณธ์ด, ํ๊ตญ์ด ๋ฐ ๊ธฐํ ์ธ์ด๋ฅผ ํฌํจํ๋ค.๋ค์ค ์ธ์ด ํ๊ฒฝ์์ ์ผ๋ จ์ ์ ๋ฌด์์ ํ์ํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค. Orion-14B ์๋ฆฌ์ฆ์ ๋ชจ๋ธ๋ค์ ์ฃผ์ ๊ณต๊ฐ ๊ธฐ์ค ์ธก์ ์์ ์ฐ์ํ ์ฑ์ ์ ๊ฑฐ๋์์ผ๋ฉฐ ์ฌ๋ฌ๊ฐ์ง ์งํ๊ฐ ๋์ผํ ํ๋ผ๋ฉํฐ๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ํ์ ํ ์ด์ํ๋ค. ๊ตฌ์ฒด์ ์ธ ๊ธฐ์ ๋ํ ์ผ์ [๊ธฐ์ ๋ณด๊ณ ์]๋ฅผ ์ฐธ๊ณ ํ์ธ์. (https://github.com/OrionStarAI/Orion/blob/master/doc/Orion14B_v3.pdf)ใ
Orion-14B์๋ฆฌ์ฆ ๋ํ ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ ํน์ง์ด ์๋ค.
- ๋ฒ ์ด์ค20B ํ๋ผ๋ฉํฐ ๋ ๋ฒจ์ธ ๋ํ ๋ชจ๋ธ์ ์ข ํฉ์ ์ธ ํ๊ฐ ๊ฒฐ๊ณผ๊ฐ ์ฐ์ํ๋ค
- ๋ค๊ตญ์ด ๋ฅ๋ ฅ์ด ๋ฐ์ด๋๊ณ ์ผ๋ณธ์ด์ ํ๊ตญ์ด ํ ์คํธ ์ธํธ์์ ํ์ ํ ์์ ๋ค
- ๋ฏธ์ธ์กฐ์ ๋ชจ๋ธ์ ์ ์์ฑ์ด ๊ฐํ๋ฉฐ ์ธ์ ํ์์ ๋ธ๋ผ์ธ๋ ํ ์คํธ์์ ํ์ฝ์ด ๋๋๋ฌ์ง๋ค
- ๊ธด ์ปจํ ์คํธ ๋ฒ์ ์ ์ต๋ 320k๊น์ง ์ง์ํ๋ 200k ํ ํฐ์ ๋ฐ์ด๋ ๊ธด ํ ์คํธ๋ฅผ ์ง์งํ๋ค
- ์ ๋ํ ๋ฒ์ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ 70% ์ค์ด๊ณ ์ถ๋ก ์๋๋ฅผ 30% ๋์ด๋ฉฐ ์ฑ๋ฅ ์์ค์ 1% ๋ฏธ๋งํ๋ค
๊ตฌ์ฒด์ ์ผ๋ก ๋งํ๋ฉด Orion-14B์๋ฆฌ์ฆ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ ๋ด์ฉ์ ํฌํจํ๋ค:
- Orion-14B-Base: 2.5์ต ํ ์ผ์ค ๋ค์ํ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ 140์ต ํ๋ผ๋ฉํฐ ๊ท๋ชจ์ ๋ค์ธ์ด ๊ธฐ๋ฐ ๋ชจ๋ธ.
- Orion-14B-Chat: ๊ณ ํ๋ฆฌํฐ ์ฝํผ์ค ๋ฏธ์ธ์กฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ํํ ๋ชจ๋ธ. ๋ํ ๋ชจ๋ธ ์ปค๋ฎค๋ํฐ๋ฅผ ์ํด ๋ ๋์ ์ฌ์ฉ์ ์ธํฐ๋์ ๊ฒฝํ์ ์ ๊ณตํ๋๋ก ํ๋ค.
- Orion-14B-LongChat: 200k ํ ํฐ ๊ธธ์ด์ ํจ๊ณผ์ ์ด๋ฉฐ ์ต๋ 320k๊น์ง ์ง์ํ๋ฉฐ ๊ธด ํ ์คํธ ํ๊ฐ ์ธํธ์์ ๋ ์ ๋ชจ๋ธ๊ณผ ๋น๊ตํ ์ ์๋ค.
- Orion-14B-Chat-RAG: ๋ง์ถฐ ์ ์ ๋ ๊ฒ์ ํฅ์ ์์ฑ ๋ฐ์ดํฐ ์ธํธ์์ ๋ฏธ์ธ์กฐ์ ํ์ฌ ๊ฒ์ ํฅ์ ์์ฑ ์์ ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ์ ๊ณตํ ์ฑํ ๋ชจ๋ธ.
- Orion-14B-Chat-Plugin: ํ๋ฌ๊ทธ์ธ ๋ฐ ํจ์ ์ ์ฉ ์์ ์ ๋ง์ถฐ ์ ์ ๋ ์ฑํ ๋ชจ๋ธ. ์์ด์ ํธ์ ๊ด๋ จ๋ ์ํฉ์ ์์ฃผ ์ ์ ์ฉ๋์ด ๋ํ ์ธ์ด ๋ชจ๋ธ์ด ํ๋ฌ๊ทธ์ธ ๋ฐ ํจ์ ์ ์ฉ ์์คํ ์ ์ญํ ์ ํ๋ค.
- Orion-14B-Base-Int4: int4๋ก ๊ณ๋ํํ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ. ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ 70%๋ฅผ ์ค์ด๋ฉฐ ์ถ๋ฆฌ ์๋๋ฅผ 30% ๋์ฌ 1%์ ์ต์ํ์ ์ฑ๋ฅ ์์ค๋ง ๊ฐ์ ธ์๋ค.
- Orion-14B-Chat-Int4: int4๋ก ๊ณ๋ํํ๋ ๋ํ ๋ชจ๋ธ.
2. ๋ค์ด๋ก๋ ๊ฒฝ๋ก
๋ฐํ๋ ๋ชจ๋ธ ๋ฐ ๋ค์ด๋ก๋ ๋งํฌ๋ ๋ค์ ํ๋ฅผ ์ฐธ์กฐํ์ธ์:
๋ชจ๋ธ ๋ช ์นญ | HuggingFace๋ค์ด๋ก๋ ๋งํฌ | ModelScope๋ค์ด๋ก๋ ๋งํฌ |
---|---|---|
โพ ๋ฒ ์ด์ค ๋ชจ๋ธ | Orion-14B-Base | Orion-14B-Base |
๐ ๋ํ ๋ชจ๋ธ | Orion-14B-Chat | Orion-14B-Chat |
๐ ๊ธด ์ปจํ ์คํธ ๋ชจ๋ธ | Orion-14B-LongChat | Orion-14B-LongChat |
๐ ๊ฒ์ ํฅ์ ๋ชจ๋ธ | Orion-14B-Chat-RAG | Orion-14B-Chat-RAG |
๐ ํ๋ฌ๊ทธ์ธ ๋ชจ๋ธ | Orion-14B-Chat-Plugin | Orion-14B-Chat-Plugin |
๐ผ ๋ฒ ์ด์คInt4๊ณ๋ํ ๋ชจ๋ธ | Orion-14B-Base-Int4 | Orion-14B-Base-Int4 |
๐ฆ ๋ํInt4๊ณ๋ํ ๋ชจ๋ธ | Orion-14B-Chat-Int4 | Orion-14B-Chat-Int4 |
3. ํ๊ฐ ๊ฒฐ๊ณผ
3.1. ๋ฒ ์ด์ค ๋ชจ๋ธOrion-14B-Baseํ๊ฐ
3.1.1. ์ ๋ฌธ ์ง์ ๋ฐ ์ํ๋ฌธ์ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | C-Eval | CMMLU | MMLU | AGIEval | Gaokao | BBH |
---|---|---|---|---|---|---|
LLaMA2-13B | 41.4 | 38.4 | 55.0 | 30.9 | 18.2 | 45.6 |
Skywork-13B | 59.1 | 61.4 | 62.7 | 43.6 | 56.1 | 48.3 |
Baichuan2-13B | 59.0 | 61.3 | 59.5 | 37.4 | 45.6 | 49.0 |
QWEN-14B | 71.7 | 70.2 | 67.9 | 51.9 | 62.5 | 53.7 |
InternLM-20B | 58.8 | 59.0 | 62.1 | 44.6 | 45.5 | 52.5 |
Orion-14B-Base | 72.9 | 70.6 | 69.9 | 54.7 | 62.1 | 56.5 |
3.1.2. ์ดํด ๋ฐ ํต์ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | RACE-middle | RACE-high | HellaSwag | PIQA | Lambada | WSC |
---|---|---|---|---|---|---|
LLaMA 2-13B | 63.0 | 58.9 | 77.5 | 79.8 | 76.5 | 66.3 |
Skywork-13B | 87.6 | 84.1 | 73.7 | 78.3 | 71.8 | 66.3 |
Baichuan 2-13B | 68.9 | 67.2 | 70.8 | 78.1 | 74.1 | 66.3 |
QWEN-14B | 93.0 | 90.3 | 80.2 | 79.8 | 71.4 | 66.3 |
InternLM-20B | 86.4 | 83.3 | 78.1 | 80.3 | 71.8 | 68.3 |
Orion-14B-Base | 93.2 | 91.3 | 78.5 | 79.5 | 78.8 | 70.2 |
3.1.3. OpenCompassํ๊ฐ ์ธํธ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | Average | Examination | Language | Knowledge | Understanding | Reasoning |
---|---|---|---|---|---|---|
LLaMA 2-13B | 47.3 | 45.2 | 47.0 | 58.3 | 50.9 | 43.6 |
Skywork-13B | 53.6 | 61.1 | 51.3 | 52.7 | 64.5 | 45.2 |
Baichuan 2-13B | 49.4 | 51.8 | 47.5 | 48.9 | 58.1 | 44.2 |
QWEN-14B | 62.4 | 71.3 | 52.67 | 56.1 | 68.8 | 60.1 |
InternLM-20B | 59.4 | 62.5 | 55.0 | 60.1 | 67.3 | 54.9 |
Orion-14B-Base | 64.3 | 71.4 | 55.0 | 60.0 | 71.9 | 61.6 |
3.1.4. ์ผ๋ณธ์ด ํ ์คํธ ์ธํธ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | Average | JCQA | JNLI | MARC | JSQD | JQK | XLS | XWN | MGSM |
---|---|---|---|---|---|---|---|---|---|
PLaMo-13B | 52.3 | 56.7 | 42.8 | 95.8 | 70.6 | 71.0 | 8.70 | 70.5 | 2.40 |
WebLab-10B | 50.7 | 66.6 | 53.7 | 82.1 | 62.9 | 56.2 | 10.0 | 72.0 | 2.40 |
ELYZA-jp-7B | 48.8 | 71.7 | 25.3 | 86.6 | 70.8 | 64.1 | 2.50 | 62.1 | 7.20 |
StableLM-jp-7B | 51.1 | 33.4 | 43.3 | 96.7 | 70.6 | 78.1 | 10.7 | 72.8 | 2.80 |
LLaMA 2-13B | 46.3 | 75.0 | 47.6 | 38.8 | 76.1 | 67.7 | 18.1 | 63.2 | 10.4 |
Baichuan 2-13B | 57.1 | 73.7 | 31.3 | 91.6 | 80.5 | 63.3 | 18.6 | 72.2 | 25.2 |
QWEN-14B | 65.8 | 85.9 | 60.7 | 97.0 | 83.3 | 71.8 | 18.8 | 70.6 | 38.0 |
Yi-34B | 67.1 | 83.8 | 61.2 | 95.2 | 86.1 | 78.5 | 27.2 | 69.2 | 35.2 |
Orion-14B-Base | 69.1 | 88.2 | 75.8 | 94.1 | 75.7 | 85.1 | 17.3 | 78.8 | 38.0 |
3.1.5. ํ๊ตญ์ด ํ ์คํธ ์ธํธn-shotํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | Average n=0 n=5 |
HellaSwag n=0 n=5 |
COPA n=0 n=5 |
BooIQ n=0 n=5 |
SentiNeg n=0 n=5 |
---|---|---|---|---|---|
KoGPT | 53.0 70.1 | 55.9 58.3 | 73.5 72.9 | 45.1 59.8 | 37.5 89.4 |
Polyglot-ko-13B | 69.6 73.7 | 59.5 63.1 | 79.4 81.1 | 48.2 60.4 | 91.2 90.2 |
LLaMA 2-13B | 46.7 63.7 | 41.3 44.0 | 59.3 63.8 | 34.9 73.8 | 51.5 73.4 |
Baichuan 2-13B | 52.1 58.7 | 39.2 39.6 | 60.6 60.6 | 58.4 61.5 | 50.3 72.9 |
QWEN-14B | 53.8 73.7 | 45.3 46.8 | 64.9 68.9 | 33.4 83.5 | 71.5 95.7 |
Yi-34B | 54.2 72.1 | 44.6 44.7 | 58.0 60.6 | 65.9 90.2 | 48.3 92.9 |
Orion-14B-Base | 74.5 79.6 | 47.0 49.6 | 77.7 79.4 | 81.6 90.7 | 92.4 98.7 |
3.1.6. ๋ค๊ตญ์ด ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | Train Lang | Japanese | Korean | Chinese | English |
---|---|---|---|---|---|
PLaMo-13B | En,Jp | 52.3 | * | * | * |
Weblab-10B | En,Jp | 50.7 | * | * | * |
ELYZA-jp-7B | En,Jp | 48.8 | * | * | * |
StableLM-jp-7B | En,Jp | 51.1 | * | * | * |
KoGPT-6B | En,Ko | * | 70.1 | * | * |
Polyglot-ko-13B | En,Ko | * | 70.7 | * | * |
Baichuan2-13B | Multi | 57.1 | 58.7 | 50.8 | 57.1 |
Qwen-14B | Multi | 65.8 | 73.7 | 64.5 | 65.4 |
Llama2-13B | Multi | 46.3 | 63.7 | 41.4 | 55.3 |
Yi-34B | Multi | 67.1 | 72.2 | 58.7 | 68.8 |
Orion-14B-Base | Multi | 69.1 | 79.5 | 67.9 | 67.3 |
3.2. ๋ํ ๋ชจ๋ธOrion-14B-Chatํ๊ฐ
3.2.1. ๋ํ ๋ชจ๋ธMTBench์ฃผ๊ด์ ํ๊ฐ
๋ชจ๋ธ ๋ช ์นญ | 1๋ผ์ด๋ | 2๋ผ์ด๋ | ํ๊ท |
---|---|---|---|
Baichuan2-13B-Chat | 7.05 | 6.47 | 6.76 |
Qwen-14B-Chat | 7.30 | 6.62 | 6.96 |
Llama2-13B-Chat | 7.10 | 6.20 | 6.65 |
InternLM-20B-Chat | 7.03 | 5.93 | 6.48 |
Orion-14B-Chat | 7.68 | 7.07 | 7.37 |
*์ด ํ๊ฐ๋ vllm์ ์ด์ฉํ์ฌ ์ถ๋ฆฌํ๋ค
3.2.2. ๋ํ ๋ชจ๋ธAlignBench์ฃผ๊ด์ ํ๊ฐ
๋ชจ๋ธ ๋ช ์นญ | ์ํ ๋ฅ๋ ฅ | ๋ ผ๋ฆฌ์ ์ถ๋ฆฌ | ๊ธฐ๋ณธ ๋ฅ๋ ฅ | ์ค๊ตญ์ด ์ดํด | ์ข ํฉ์ ๋ฌธ๋ต | ๊ธ์ฐ๊ธฐ ๋ฅ๋ ฅ | ๋กค ํ๋ ์ด | ์ ๋ฌธ ์ง์ | ํ๊ท |
---|---|---|---|---|---|---|---|---|---|
Baichuan2-13B-Chat | 3.76 | 4.07 | 6.22 | 6.05 | 7.11 | 6.97 | 6.75 | 6.43 | 5.25 |
Qwen-14B-Chat | 4.91 | 4.71 | 6.90 | 6.36 | 6.74 | 6.64 | 6.59 | 6.56 | 5.72 |
Llama2-13B-Chat | 3.05 | 3.79 | 5.43 | 4.40 | 6.76 | 6.63 | 6.99 | 5.65 | 4.70 |
InternLM-20B-Chat | 3.39 | 3.92 | 5.96 | 5.50 | 7.18 | 6.19 | 6.49 | 6.22 | 4.96 |
Orion-14B-Chat | 4.00 | 4.24 | 6.18 | 6.57 | 7.16 | 7.36 | 7.16 | 6.99 | 5.51 |
*์ด ํ๊ฐ๋ vllm์ ์ด์ฉํ์ฌ ์ถ๋ฆฌํ๋ค
3.3. ๊ธด ์ปจํ ์คํธ ๋ชจ๋ธOrion-14B-LongChatํ๊ฐ
3.3.1. ๊ธด ์ปจํ ์คํธ ๋ชจ๋ธLongBenchํ๊ฐ
๋ชจ๋ธ ๋ช ์นญ | NarrativeQA | MultiFieldQA-en | MultiFieldQA-zh | DuReader | QMSum | VCSUM | TREC | TriviaQA | LSHT | RepoBench-P |
---|---|---|---|---|---|---|---|---|---|---|
GPT-3.5-Turbo-16k | 23.60 | 52.30 | 61.20 | 28.70 | 23.40 | 16.00 | 68.00 | 91.40 | 29.20 | 53.60 |
LongChat-v1.5-7B-32k | 16.90 | 41.40 | 29.10 | 19.50 | 22.70 | 9.90 | 63.50 | 82.30 | 23.20 | 55.30 |
Vicuna-v1.5-7B-16k | 19.40 | 38.50 | 43.00 | 19.30 | 22.80 | 15.10 | 71.50 | 86.20 | 28.80 | 43.50 |
Yi-6B-200K | 14.11 | 36.74 | 22.68 | 14.01 | 20.44 | 8.08 | 72.00 | 86.61 | 38.00 | 63.29 |
Orion-14B-LongChat | 19.47 | 48.11 | 55.84 | 37.02 | 24.87 | 15.44 | 77.00 | 89.12 | 45.50 | 54.31 |
3.4. ๊ฒ์ ํฅ์ ๋ชจ๋ธOrion-14B-Chat-RAGํ๊ฐ
3.4.1. ์๊ธฐ ๋ง๋ ๊ฒ์ ํฅ์ ํ ์คํธ ์ธํธ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | ์๋ต ํจ๊ณผ(ํค์๋) | *์๋ต ํจ๊ณผ(์ฃผ๊ด์ ์ ์) | ์ธ์ฉ ๋ฅ๋ ฅ | ๊ธฐ๋ณธ ๋ ๋งก๋ ๋ฅ๋ ฅ | *AutoQA | *๋ฐ์ดํฐ ์ถ์ถ |
---|---|---|---|---|---|---|
Baichuan2-13B-Chat | 85 | 76 | 1 | 0 | 69 | 51 |
Qwen-14B-Chat | 79 | 77 | 75 | 47 | 68 | 72 |
Qwen-72B-Chat(Int4) | 87 | 89 | 90 | 32 | 67 | 76 |
GPT-4 | 91 | 94 | 96 | 95 | 75 | 86 |
Orion-14B-Chat-RAG | 86 | 87 | 91 | 97 | 73 | 71 |
* ์ฌ๋ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ๋ฆฌํจ๋ค |
3.5. ํ๋ฌ๊ทธ์ธ ๋ชจ๋ธOrion-14B-Chat-Pluginํ๊ฐ
3.5.1. ์๊ธฐ ๋ง๋ ํ๋ฌ๊ทธ์ธ ํ ์คํธ ์ธํธ ํ๊ฐ ๊ฒฐ๊ณผ
๋ชจ๋ธ ๋ช ์นญ | ํ ํ๋ผ๋ฉํฐ ์๋ ์๋ณ | ๋ถ์์ ํ๋ผ๋ฉํฐ ์๋ ์๋ณ | ๋น ํ๋ฌ๊ทธ์ธ ์ ์ฉ ์๋ณ |
---|---|---|---|
Baichuan2-13B-Chat | 25 | 0 | 0 |
Qwen-14B-Chat | 55 | 0 | 50 |
GPT-4 | 95 | 52.38 | 70 |
Orion-14B-Chat-Plugin | 92.5 | 60.32 | 90 |
3.6. ๊ณ๋ํ ๋ชจ๋ธOrion-14B-Base-Int4ํ๊ฐ
3.6.1. ๊ณ๋ํ ์ ํ ์ ๋ฐ์ ์ธ ๋น๊ต
๋ชจ๋ธ ๋ช ์นญ | ๋ชจ๋ธ ํฌ๊ธฐ(GB) | ์ถ๋ฆฌ ์๋(ํ ํฐ ์/์ด) | C-Eval | CMMLU | MMLU | RACE | HellaSwag |
---|---|---|---|---|---|---|---|
OrionStar-14B-Base | 28.0 | 135 | 72.8 | 70.6 | 70.0 | 93.3 | 78.5 |
OrionStar-14B-Base-Int4 | 8.3 | 178 | 71.8 | 69.8 | 69.2 | 93.1 | 78.0 |
4. ๋ชจ๋ธ ์ถ๋ฆฌ
์ถ๋ฆฌ์ ํ์ํ ๋ชจ๋ธ ๊ฐ์ค์น, ์์ค ์ฝ๋, ๋ฐฐ์น๋ Hugging Face์ ๊ฒ์๋์ด ๋ค์ด๋ก๋ ๋งํฌ๋ ์ด ํ์ผ ๋งจ ์ฒ์์ ์๋ ํ๋ฅผ ์ฐธ์กฐํ์ธ์. ์ ํฌ๋ ์ฌ๊ธฐ์ ๋ค์ํ ์ถ๋ฆฌ ๋ฐฉ์์ ๋ณด์ฌ ์ฃผ๊ณ ํ๋ก๊ทธ๋จ์ Hugging Face๋ก๋ถํฐ ํ์ํ ์๋ฃ๋ฅผ ์๋์ผ๋ก ๋ค์ด๋ก๋ ํ ๊ฒ์ด๋ค.
4.1. Python ์ฝ๋ ๋ฐฉ์
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig
tokenizer = AutoTokenizer.from_pretrained("OrionStarAI/Orion-14B", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("OrionStarAI/Orion-14B", device_map="auto",
torch_dtype=torch.bfloat16, trust_remote_code=True)
model.generation_config = GenerationConfig.from_pretrained("OrionStarAI/Orion-14B")
messages = [{"role": "user", "content": "์๋
! ์ด๋ฆ์ด ๋ญ์์!"}]
response = model.chat(tokenizer, messages, streaming=Flase)
print(response)
์์ ๋ ์ฝ๋์์ ๋ชจ๋ธ์ ์ง์ ๋ device_map='auto'
๋ก๋ฉํ๋ฉด ๋ชจ๋ ์ฌ์ฉํ ์ ์๋ ๊ทธ๋ํฝ ์นด๋๋ฅผ ์ฌ์ฉํ ๊ฒ์ด๋ค. ์ฌ์ฉํ ์ฅ์น๋ฅผ ์ง์ ํ๋ ค๋ฉด export CUDA_VISIBLE_DEVICES=0,1
(๊ทธ๋ํฝ ์นด๋ 0๊ณผ 1์ ์ฌ์ฉ)๊ณผ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์ ์ดํ ์ ์๋ค.
4.2. ๋ช ๋ น์ค ํด ๋ฐฉ์
CUDA_VISIBLE_DEVICES=0 python cli_demo.py
์ด ๋ช ๋ น์ค ํด์ Chat ์๋๋ฆฌ์ค๋ฅผ ์ํด ์ค๊ณ๋์์ผ๋ฏ๋ก ์ด ํด๋ก ๋ฒ ์ด์ค ๋ชจ๋ธ์ ์ ์ฉํ๋ ๊ฒ ์ง์ํ์ง ์๋๋ค.
4.3. ์คํฌ๋ฆฝํธ ์ง์ ์ถ๋ฆฌ
# base model
CUDA_VISIBLE_DEVICES=0 python demo/text_generation_base.py --model OrionStarAI/Orion-14B --tokenizer OrionStarAI/Orion-14B --prompt ์๋
. ์ด๋ฆ์ด ๋ญ์์
# chat model
CUDA_VISIBLE_DEVICES=0 python demo/text_generation.py --model OrionStarAI/Orion-14B-Chat --tokenizer OrionStarAI/Orion-14B-Chat --prompt ์๋
. ์ด๋ฆ์ด ๋ญ์์
4.4. vLLM ์ถ๋ก ์ ํตํด
ํ๋ก์ ํธ ์ฃผ์
https://github.com/vllm-project/vllmํ ๋ฆฌํ์คํธ
https://github.com/vllm-project/vllm/pull/2539
4.5. llama.cpp ์ถ๋ก ์ ํตํด
ํ๋ก์ ํธ ์ฃผ์
https://github.com/ggerganov/llama.cppํ ๋ฆฌํ์คํธ
https://github.com/ggerganov/llama.cpp/pull/5118GGUF ํ์์ผ๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ
python convert-hf-to-gguf.py path/to/Orion-14B-Chat --outfile chat.gguf
๋ชจ๋ธ ์ถ๋ก ๋ฐฉ๋ฒ
./main --frequency-penalty 0.5 --frequency-penalty 0.5 --top-k 5 --top-p 0.9 -m chat.gguf -p "Building a website can be done in 10 simple steps:\nStep 1:" -n 400 -e
4.6. ์์ ๋ ธ์ถ
4.6.1. ์ก๋ด
์ฌ์ฉ์๏ผ์๋
,์ด๋ฆ์ด ๋ญ์์
Orion-14B๏ผ์๋
! ์ ๋ ์ธ๊ณต์ง๋ฅ ์กฐ์ ์
๋๋ค. ์ ํด์ง ์ด๋ฆ์ ์๊ณ ๋ง์๋๋ก ๋ถ๋ฌ๋ ๋ฉ๋๋ค. ๋์์ค ์ ์๋ ๊ฑฐ ์๋์?
์ฌ์ฉ์๏ผ์ด์ผ๊ธฐ ํ๋ ๋๋ ์ค
Orion-14B๏ผ์์ ์ ์ญ์ด๋ผ๋ ์ด๋ฆฐ ์๋
์ด ์์๋ค. ๊ทธ๋ ์์ ๋ง์์ ์ด์๋ค. ์ญ์ ๋ชจํ๊ณผ ํ๊ตฌ๋ฅผ ๋งค์ฐ ์ข์ํด์ ํญ์ ์ ๊ธฐํ ๊ฒ์ ๋ฐ๊ฒฌํ๋ ๊ฟ์ ๊พผ๋ค.
์ด๋๋ ์ญ์ ๊ทผ์ฒ์ ์ฒ ๊น์ ๊ณณ์ ์ ์ค์์ ๋ง๋ฒ์ฑ์ด ์์ด ๊ทธ ์์ ์ฌ์
ํ ๊ฑฐ์ธ์ด ์ฐ๋ค๋ ์์์ ๋ ๋ค. ๊ทธ ๊ฑฐ์ธ์ ์ด๋ฆ์ ๊ทธ๋ฆผ์ด์๋ค. ๊ทธ๋ ์ฑ ์์ ๊ฐํ ์ฑ ๋ ๋ ์ ์์๋ค.
์ญ์ ๊ทธ๋ฆผ์ด ๊ทธ๊ณณ์ ๊ฐํ์๋ ์ด์ ๊ฐ ๊ผญ ์์ ๊ฑฐ๋ผ๊ณ ๋ฏฟ๊ธฐ ๋๋ฌธ์ ๊ฑฐ์ธ์ ๊ตฌํ๋ฌ ๊ฐ๊ธฐ๋ก ๊ฒฐ์ฌํ๋ค. ๊ทธ๋ฆฌํ์ฌ ๊ทธ๋ ์ฉ๊ธฐ์ ๊ฒฐ์ฌ์ ๊ฐ์ ธ ๋ง๋ฒ์ ์ฑ์ผ๋ก ๊ฐ๋ ์ฌ์ ์ ์์ํ๋ค.
์ค๋ ๊ณ ์ ๋์ ์ญ์ ๋ง์นจ๋ด ์ฑ๋ณด ๋๋ฌธ ์์ ๋ค๋ค๋๋ค. ๊ทธ๋ ์กฐ์ฌ์ค๋ฝ๊ฒ ๋๋ฌธ์ ์ด๊ณ ์ ๋นํ ๊ธฐ์ด์ด ๊ฐ๋ํ ๋ฐฉ์ผ๋ก ๋ค์ด๊ฐ๋ค.
๋ฐฉ์์ ์ด๋์ด ๊ธฐ์ด์ด ๊ฐ๋ํ์ง๋ง ์ญ์ ๋๋ผ์ง ์์๋ค. ๊ทธ๋ ์ฉ๊ฐํ๊ฒ ์ฑ ์์ผ๋ก ๋ค์ด๊ฐ ๋ง์นจ๋ด ๊ทธ๋ฆผ์ ์ฐพ์๋๋ค.
๊ทธ๋ฆผ์ ์์ ์ ์ฌ์
ํ ๋ง๋
์ ์ ์ฃผ๋ฅผ ๋ฐ์์ ์ ์ฃผ๋ฅผ ํ์ด์ผ๋ง ์์ ๋ก์์ง ์ ์๋ค๊ณ ์ญ์๊ฒ ๋งํ๋ค. ์ญ์ ๊ทธ๋ฆผ์ ๋๊ธฐ๋ก ๊ฒฐ์ ํ์ฌ ๋จ์์ ์ฃผ๋ฌธ์ ํ ๋ฐฉ๋ฒ์ ์ฐพ๊ธฐ ์์ํ๋ค.
ํ๋ฐํ์ ๋
ธ๋ ฅ ๋์ ์ญ์ ๋๋์ด ๋ง๋
์ ๋น๋ฐ ์คํ์ค๋ก ๊ฐ๋ ๊ธธ์ ์ฐพ์๋ธ๋ค. ๊ทธ๋ ๊ทธ๊ณณ์์ ๋ง๋
๊ฐ ๋จ๊ธด ๋ง๋ฒ์๋ฅผ ๋ฐ๊ฒฌํ๋๋ฐ ๊ทธ ์ฑ
์์ ์ฃผ๋ฌธ์ ํธ๋ ๋ฐฉ๋ฒ์ด ์ ํ ์์๋ค.
์ญ์ ์ฑ
์ ์ฐ์ธ ์ ์ฐจ๋ฅผ ๋ฐ๋ผํ์ฌ ๊ทธ๋ฆผ์ ์ ์ฃผ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ํ์ด๋๋ค. ๊ฑฐ์ธ์ ๋๋ฌด ๊ฐ์ฌํด์ ์ญ์ ์์์ด ์ด๋ฃจ์ด์ง๋๋ก ๋๊ฒ ๋ค๊ณ ์ฝ์ํ๋ค.
์ด๋๋ก๋ถํฐ ์ญ๊ณผ ๊ทธ๋ฆผ์ ์ข์ ์น๊ตฌ๊ฐ ๋์ด ๋ง์ ์ํํ๊ณ ์ง๋ฆฟํ ๋ชจํ์ ํจ๊ป ๊ฒช์์ผ๋ฉฐ ๊ทธ๋ค์ ์ฉ๊ธฐ์ ์งํ๋ก ๊ฐ์ข
์ด๋ ค์์ ์ด๊ฒจ๋๋ค.
์ด ์ด์ผ๊ธฐ๋ ์ ํฌ์๊ฒ ์ฉ๊ธฐ์ ๊ฒฐ์ฌ์ด ์๋ค๋ฉด ๋ชจ๋ ์ด๋ ค์์ ๊ทน๋ณตํ๊ณ ์์ ์ ๊ฟ์ ์ด๋ฃฐ ์ ์๋ค๋ ๊ฒ์ ์๋ ค์ค๋ค.
4.6.2. ํ์ผ
็จๆท๏ผ่ชๅทฑใ็ดนไปใใฆใใ ใใ
Orion-14B๏ผใใใซใกใฏใ็งใฎๅๅใฏChatMaxใงใOrionStarใซใใฃใฆ้็บใใใAIใขใทในใฟใณใใงใใ็งใฏใฆใผใถใผใซๆญฃ็ขบใงใๅฎข่ฆณ็ใงใๆ็จใชๅ็ญใๆไพใใๅฝผใใๅ้กใ่งฃๆฑบใใๆ
ๅ ฑใๅๅพใใใฎใๅฉใใใใจใใงใใพใใ
็จๆท๏ผ์๊ธฐ์๊ฐ๋ฅผ ํด์ฃผ์ธ์.
Orion-14B๏ผ์๋
ํ์ธ์, ์ ๋ช
์นญ์ ChatMax์
๋๋ค. OrionStar์์ ๊ฐ๋ฐํ AI ์ด์์คํดํธ์
๋๋ค. ์ ๋ ์ฌ์ฉ์๋ค์๊ฒ ์ ํํ๊ณ ๊ฐ๊ด์ ์ด๋ฉฐ ์ ์ฉํ ๋ต๋ณ์ ์ ๊ณตํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ๋ณด๋ฅผ ์ป๋ ๋ฐ ๋์์ ์ค ์ ์์ต๋๋ค.
5. ์ฑ๋ช , ํ์
5.1. ์ฑ๋ช
์ ํฌ๋ ๋ชจ๋ ์ฌ์ฉ์๋ค์๊ฒ Orion-14B๋ชจ๋ธ์ ์ด์ฉํ์ฌ ๊ตญ๊ฐ ์ฌํ ์์ ์ ํด์น๊ฑฐ๋ ๋ถ๋ฒ์ ์ธ ํ์๋ฅผ ํ๋ ๊ฑฐ ํ์ง ์๋๋ก ๊ฐ๋ ฅํ ํธ์ํ๋ค. ๋ํ, ์ ํฌ๋ ์ฌ์ฉ์๋ค์๊ฒ Orion-14B ๋ชจ๋ธ์ ์ ์ ํ ๋ณด์ ๊ฒํ ๋ฅผ ํ์ง ์๊ฑฐ๋ ๋ฌธ์ํ๋์ง ์์ ์ธํฐ๋ท ์๋น์ค๋ก ์ด์ฉํ์ง ๋ง๋ผ๋ ๊ฒ์ ์์ฒญํ๋ค.
์ ํฌ๋ ๋ชจ๋ ์ฌ์ฉ์๊ฐ ์ด ์์น์ ์งํค๋ฉฐ ๊ธฐ์ ์ ๋ฐ์ ์ด ๊ท๋ฒ์ ์ด๊ณ ํฉ๋ฒ์ ์ธ ํ๊ฒฝ์์ ์ด๋ฃจ์ด์ง ์ ์๊ธฐ๋ฅผ ๋ฐ๋๋ค. ์ ํฌ๋ ์ด๋ฏธ ์ต์ ์ ๋คํด ๋ชจ๋ธ ํ๋ จ ๊ณผ์ ์์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ์ ์ค์น์ฑ์ ํ๋ณดํ๋๋ก ํ์๋ค. ๊ทธ๋ฌ๋ ๋ง๋ํ ๋ ธ๋ ฅ์ ๊ธฐ์ธ์์์๋ ๋ถ๊ตฌํ๊ณ ๋ชจ๋ธ๊ณผ ๋ฐ์ดํฐ์ ๋ณต์ก์ฑ์ผ๋ก ๋ง๋ฏธ์์ ์ผ๋ถ ์๊ฒฌํ ์ ์์ ๋ฌธ์ ๋ค์ด ์ฌ์ ํ ์กด์ฌํ ์ ์๋ค. ๋ฐ๋ผ์ Orion-14B ์คํ์์ค ๋ชจ๋ธ์ ์ฌ์ฉ์ผ๋ก ์ผ๊ธฐ๋ ๋ฌธ์ , ๋ฐ์ดํฐ ๋ณด์ ๋ฌธ์ ์ ๊ณต๋ก ์ํ์ด๋ ๋ชจ๋ธ์ ์ค๋, ๋จ์ฉ, ์ ํ, ๋ํ ๋ถ์ ๋นํ ์ฌ์ฉ ๋ฑ์ผ๋ก ๊ฐ์ ธ์จ ์ํ๊ณผ ๋ฌธ์ ์ ๋ํด ์ ํฌ๋ ์ฑ ์์ ์ง์ง ์๊ฒ ๋ค.
5.2. ํ์
์ปค๋ฎค๋ํฐ ์ฌ์ฉOrion-14B์๋ฆฌ์ฆ ๋ชจ๋ธ
- ์ฝ๋๋ Apache License Version 2.0
๋ฐ๋ฅด์ธ์ - ๋ชจ๋ธ์ Orion-14B์๋ฆฌ์ฆ ๋ชจ๋ธ ์ปค๋ฎค๋ํฐ ํ๊ฐ ํ์๋ฐ๋ฅด์ธ์
6. ํ์ฌ์๊ฐ
์ค๋ฆฌ์จ ์คํ๏ผOrionStar๏ผ๋ 2016๋ 9์ ์ค๋ฆฝ๋ ์ธ๊ณ ์ต๊ณ ์ ์๋น์ค ๋ก๋ด ์๋ฃจ์ ํ์ฌ์ด๋ค. ์ค๋ฆฌ์จ ์คํ๋ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ๋ฐํ์ผ๋ก ์ฐจ์ธ๋ ํ๋ช ์ ๋ก๋ด ๋ง๋ค์ด ์ฌ๋๋ค์ด ๋ฐ๋ณต๋๋ ์ก์ฒด๋ ธ๋์์ ๋ฒ์ด๋ ์ผ๊ณผ ์ํ์ ๋์ฑ ์ง๋ฅ์ ์ด๊ณ ์ฌ๋ฏธ์๊ฒ ๋ง๋ค๊ณ ๊ธฐ์ ์ ํตํด ์ฌํ์ ์ธ๊ณ๋ฅผ ๋์ฑ ์๋ฆ๋ต๊ฒ ๋ง๋ ๊ฒ์ ํ์ ๊ธฐ์ธ์ธ๋ค.
์ค๋ฆฌ์จ ์คํ๋ ์์ฑ ์ธํฐ๋ ์ ๊ณผ ์๊ฐ ๋ค๋น๊ฒ์ด์ ๋ฑ ์์ ํ ๋ ์์ ์ผ๋ก ๊ฐ๋ฐํ ํ ์ฒด์ธ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ๊ฐ์ง๊ณ ์๋ค. ์ ํฌ๋ ํ๋ก๋ํธ ๊ฐ๋ฐ ๋ฅ๋ ฅ๊ณผ ๊ธฐ์ ์์ฉ ๋ฅ๋ ฅ์ ํตํฉํ์๋ค. ์ค๋ฆฌ์จ ๋ก๋ด ํ ํ๋ซํผ์ ๊ธฐ๋ฐ์ผ๋ก ORIONSTAR AI Robot Greeting, AI Robot Greeting Mini, Lucki, CoffeeMaster ๋ฑ์ ํ๋ก๋ํธ ์ถ์ํ์์ผ๋ฉฐ ์ค๋ฆฌ์จ ๋ก๋ด์ ์คํ ํ๋ซํผ์ธ OrionOS๋ฅผ ์ค๋ฆฝํ์๋ค. ์ง์ง ์ ์ฉํ ๋ก๋ด์ ์ํด ํ์ด๋๋ผ์ ์ด๋ ์ ์ํ ์ค์ฒํ์ฌ AI๊ธฐ์ ์ ํตํด ๋ ๋ง์ ์ฌ๋๋ค์๊ฒ ๋ฅ๋ ฅ์ ๋ถ์ฌํ๋ค.
7๋ ์ AI๊ฒฝํ ๋์ ์ ๋ฐํ์ผ๋ก ์ค๋ฆฌ์จ ์คํ๋ ๋ํ ๋ชจ๋ธ ์ฌ์ธต ์์ฉ"์ฅ์ธ(Chatmax)"์ ์ถ์ํ๊ณ ์ ๊ณ ๊ณ ๊ฐ์๊ฒ ๋ง์ถคํ AI๋ํ ๋ชจ๋ธ ์ปจ์คํ ๊ณผ ์๋น์ค ์๋ฃจ์ ์ ์ง์์ ์ผ๋ก ์ ๊ณตํ์ฌ ์ง์ ์ผ๋ก ๊ธฐ์ ๊ฒฝ์ ํจ์จ์ด ๋์ข ์ ๊ณ์ ์์๋ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ ์ ์๋๋ก ๊ณ ๊ฐ๋ค์๊ฒ ๋๊ณ ์๋ค.
์ค๋ฆฌ์จ ์คํ๋ ํ ์ฒด์ธ ๋ํ ๋ชจ๋ธ ์์ฉ๋ฅ๋ ฅ์ด๋ ํต์ฌ์ ์ฐ์ธ๋ฅผ ๊ฐ๊ณ ์๋ค, ๋๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ํ ๋ชจ๋ธ ์ฌ์ ํ๋ จ, 2์ฐจ ์ฌ์ ํ๋ จ, ๋ฏธ์ธ ์กฐ์ (Fine-tune), PromptEngineering, Agent๋ฑ์์ ๊ฐ๋ฐ๋ ํ ์ฒด์ธ ๋ฅ๋ ฅ๊ณผ ๊ฒฝํ ๋์ ์ ๊ฐ์ง๋ ๊ฑฐ ํฌํจํ๋ค. ์ฒด๊ณํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์ ์ฐจ์ ์๋ฐฑ ๊ฐ์ GPU์ ๋ณ๋ ฌ ๋ชจ๋ธ ํ๋ จ ๋ฅ๋ ฅ์ ํฌํจํ ์์ ํ ์๋ํฌ์๋ ๋ชจ๋ธ ํ๋ จ ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ ํ์ฌ ๋ํ ์ ๋ฌด, ํด๋ผ์ฐ๋ ์๋น์ค, ์ถํด ์ ์์๊ฑฐ๋, ์พ์์๋นํ ๋ฑ ์ฌ๋ฌ ์ ๊ณ์์ ๊ตฌํ๋์๋ค.
๋ํ ๋ชจ๋ธ ์์ฉ ๊ตฌํ ํ์๊ฐ ์์ผ์ ํ์ฌ๊ป์ ์ ํฌ์ ์ฐ๋ฝํ๋ ๊ฒ์ ํ์ํ๋ค
๋ฌธ์ ์ ํ: 400-898-7779
์ด๋ฉ์ผ: ai@orionstar.com
Discord ์ปค๋ฎค๋ํฐ ๋งํฌ: https://discord.gg/zumjDWgdAs