|
--- |
|
library_name: transformers |
|
license: cc-by-nc-sa-4.0 |
|
--- |
|
|
|
# The license is cc-by-nc-sa-4.0. |
|
|
|
- Commercializing is not allowed. |
|
|
|
![mark1](ko-1.4.png) |
|
|
|
|
|
|
|
# Model Card for Model ID |
|
|
|
๊ธฐ์กด์ DopeorNope/Ko-Mixtral-v1.3-MoE-7Bx2 ๋ชจ๋ธ์์ ํฅ์๋ 1.4๋ฒ์ ์
๋๋ค. |
|
|
|
์ถ๊ฐ๋ ์ฌํญ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. |
|
|
|
1. ํ๋ จ์ ํ์ฉ๋ ์ฝํผ์ค๋ฅผ ๋งค๋ด์ผํ๊ฒ ๊ฒํ ํ๊ณ ์ด์ํ ์ฝํผ์ค๋ฅผ ์์ ํ๊ณ ์ ์ ํ์์ต๋๋ค. |
|
2. Near dudup ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ์ค๋ณต๋๋ ์ฝํผ์ค๋ฅผ ์ ๊ฑฐํ์์ต๋๋ค. |
|
3. ๊ธฐ์กด์ 3๊ฐ์ง task์์ ํ๊ฐ์ง task๋ฅผ ์ถ๊ฐํ์์ต๋๋ค. |
|
|
|
|
|
|
|
## Model Details |
|
|
|
### Model Description |
|
- **Developed by:** DopeorNope(Seungyoo Lee), kyujinpy(Kyujin Han) |
|
- **Model type:** Mixtral |
|
- **Language:** English based model but finetuned with Korean corpus |
|
- **License:** cc-by-nc-sa-4.0 |
|
- **Finetuned from model:** DopeorNope/Ko-Mixtral-v1.3-MoE-7Bx2 |
|
- **funded by:** the Ministry of Science and ICT(MSIT, Korea) & Gwangju Metropolitan City |
|
|
|
## Training |
|
|
|
#### Testing Data |
|
|
|
AI-HUB์์ ์ ๊ณต๋ ์ฝํผ์ค๋ฅผ ๊ฐ์ง๊ณ ๋ค์๊ณผ ๊ฐ์ 4๊ฐ์ง task๋ฅผ text mining์ผ๋ก ๋ง๋ค์ด ์ ์ฉํ์์ต๋๋ค. |
|
|
|
- **1.Mask prediction Task** |
|
|
|
```python |
|
|
|
#Mask prediction |
|
|
|
#๋ฌธ์ฅ์์ ํ๊ตญ์ด ๋จ์ด๋ฅผ ๋ง์คํน ํ ์ดํ, ์ด ๋จ์ด๋ฅผ ์์ธกํ๊ฒ ๋ง๋๋ Task์
๋๋ค. |
|
|
|
Text='์ง๋ฅ(ๆบ่ฝ) ๋๋ ์ธํ
๋ฆฌ์ ์ค(intelligence)๋ ์ธ๊ฐ์ <MASK> ๋ฅ๋ ฅ์ ๋งํ๋ค.' |
|
|
|
Response='์ง์ ' |
|
|
|
Complete_text='์ง๋ฅ(ๆบ่ฝ) ๋๋ ์ธํ
๋ฆฌ์ ์ค(intelligence)๋ ์ธ๊ฐ์ ์ง์ ๋ฅ๋ ฅ์ ๋งํ๋ค.' |
|
|
|
``` |
|
- **2.Text-allign Task** |
|
|
|
```python |
|
|
|
#Text-allign Task |
|
|
|
#๋ฌธ๋จ์์ ๊ฐ ๋ฌธ์ฅ๋ค์ ์ถ์ถํ๊ณ ์ถ์ถํ ๋ฌธ์ฅ๋ค์ ๋ฌด์์๋ก ์์ ํ ์์ ๋ฌธ์ฅ๋ค์ ๋ฌธ๋งฅ์ ์ ์ ํ๊ฒ ๋ฐฐ์ดํ๋ ํ์คํธ ์
๋๋ค. |
|
|
|
Text_list=['๋ณต์๋ช
๋ น-๋ณต์์๋ฃ(MIMD,Multiple Instruction, Multiple Data)์ ์ ์ฐ์์ ๋ณ๋ ฌํ์ ํ ๊ธฐ๋ฒ์ด๋ค.', |
|
'๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ ์๋ MPP(massively parallel processors)์ COW (Clusters of Workstations)์ด๋ค.', |
|
'MIMD๊ธฐ๊ณ๋ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ์ด๊ฑฐ๋ ๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ด๋ฉฐ ์ด๋ฌํ ๋ถ๋ฅ๋ MIMD๊ฐ ์ด๋ป๊ฒ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ด์ฉํ๋๋์ ๋ฐ๋ผ ๋๋๋ค.'] |
|
|
|
|
|
|
|
Response='๋ณต์๋ช
๋ น-๋ณต์์๋ฃ(MIMD,Multiple Instruction, Multiple Data)์ ์ ์ฐ์์ ๋ณ๋ ฌํ์ ํ ๊ธฐ๋ฒ์ด๋ค. |
|
MIMD๊ธฐ๊ณ๋ ๊ณต์ ๋ฉ๋ชจ๋ฆฌ์ด๊ฑฐ๋ ๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ด๋ฉฐ ์ด๋ฌํ ๋ถ๋ฅ๋ MIMD๊ฐ ์ด๋ป๊ฒ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ด์ฉํ๋๋์ ๋ฐ๋ผ ๋๋๋ค. |
|
๋ถ์ฐ ๋ฉ๋ชจ๋ฆฌ์ ์๋ MPP(massively parallel processors)์ COW (Clusters of Workstations)์ด๋ค.' |
|
|
|
``` |
|
|
|
- **3.Text completion Task** |
|
|
|
```python |
|
|
|
#Text Completion |
|
|
|
# ๋ฌธ๋จ์์ ๋ง์ง๋ง ๋ฌธ์ฅ์ ์ถ์ถํ๊ณ , ์ถ์ถ๋ ๋ฌธ์ฅ์ ์ด์ ์ ๋ฌธ๋จ๊น์ง๋ฅผ input์ผ๋ก ํ์ฌ ๋ง์ง๋ง ๋ฌธ์ฅ์ ์์ธกํ๊ฒ ํ๋ ๊ณผ์ ์
๋๋ค. |
|
|
|
Text= '๊ทธ๋ฆฐ๋ธ๋ผ์ฐ์ (GreenBrowser)๋ ์ธํฐ๋ท ์ต์คํ๋ก๋ฌ์์ ์ฌ์ฉํ๋ ํธ๋ผ์ด๋ํธ ๋ ์ด์์ ์์ง์ ๋ฐํ์ผ๋ก ํ๋ฉฐ ์ค๊ตญ์ ๊ธฐ๋ฐ์ ๋ ์ํํธ์จ์ด ํ์ฌ์ธ ๋ชจ์ดํต(morequick)์์ ๋ง๋ ๋ฌด๋ฃ ์น ๋ธ๋ผ์ฐ์ ๋ค. ๊ฐ์ฒด์ ์ค๊ตญ์ด๊ฐ ์น ๋ธ๋ผ์ฐ์ ์ ๋ด์ฅ๋์ด ์๋ค. |
|
๋งฅ์คํค ์น ๋ธ๋ผ์ฐ์ ์ ๋น์ทํ์ฌ MyIE์ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋์ด ์๋ค. ๋งฅ์คํค์ฉ์ ์ผ๋ถ ํ๋ฌ๊ทธ์ธ์ด ๊ทธ๋ฆฐ๋ธ๋ผ์ฐ์ ์์๋ ์๋ํ ๊ฒ์ด๋ค.' |
|
|
|
|
|
Response= '์๋ ์คํฌ๋กค, ์๋ ๋ฆฌํ๋ ์, ์๋ ์ ์ฅ, ์๋ ํผ ์ฑ์ฐ๊ธฐ์ ๊ฐ์ ๋ง์ ์๋ํ ๊ธฐ๋ฅ์ด ์๋ค.' |
|
|
|
``` |
|
- **4. Sentence Genration** |
|
|
|
```python |
|
|
|
#Text Completion |
|
|
|
# ๋ฌธ์ฅ์์ ๋ชจ๋ ๋จ์ด๋ค์ ์ถ์ถํ๊ณ ๋ฌด์์๋ก ์์ ํ ์ค๋ณต๋ ๋จ์ด๋ฅผ ์ ๊ฑฐํ๊ณ , ์ ์๋ ๋จ์ด ๋ฆฌ์คํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ฒฝํ ๋ฌธ์ฅ์ ์์ฑํด๋ด๋ task์
๋๋ค. |
|
|
|
Word_List: ['ฯ์', '์ ์ด์์๋', '์ ์ด์', 'ํํ์ด', 'ฯ', '๋ก๋ด', '์ฐ์ธ๋ค', 'ฮธ', '๊ฐ์', '์์ฃผ', '๊ธฐ๊ธฐ'] |
|
|
|
|
|
|
|
response= '์๋ ์คํฌ๋กค, ์๋ ๋ฆฌํ๋ ์, ์๋ ์ ์ฅ, ์๋ ํผ ์ฑ์ฐ๊ธฐ์ ๊ฐ์ ๋ง์ ์๋ํ ๊ธฐ๋ฅ์ด ์๋ค.' |
|
|
|
``` |
|
|
|
### Environments |
|
|
|
|
|
- **Hardware Type:** Nvidia A100 x 4 |
|
- **Training hours:** 3 Days |
|
|