Model Card for Model ID
์ด ๋ชจ๋ธ์ KM-BERT์ ๋ชจ๋ธ์ ๋ค์ด ๋ฐ์, ์์๋ก ํ๊น
ํ์ด์ค ๋ชจ๋ธ์ ํํ๋ก ์ฌ์ฉํ๊ธฐ ์ข๊ฒ ๋ณํํ ๋ชจ๋ธ ์
๋๋ค.
๋ชจ๋ธ์ ๊ทธ๋๋ก์ด๊ณ , ํ ํฌ๋์ด์ ๋ ๋
ผ๋ฌธ์ ๋์ ์๋๋๋ก, snunlp/KR-BERT-char16424 ๊ฒ์ ๊ฐ์ ธ์์ต๋๋ค
KM-BERT๋ฅผ ์ฌ์ฉํด๋ณผ ์ ์๊ฒ ๊ณต์ ํด์ฃผ์ ์ ์๋ถ๊ป ๊ฐ์ฌ๋๋ฆฝ๋๋ค.
๋ฌธ์ ๋ฐ์ ์ ์์ ํ๊ฑฐ๋, ๋๋ ์ ์๋์ ์์ฒญ์ ํ๋ธ์์ ๋ด๋ฆด ์๋ ์์ต๋๋ค.
Model Details
bing ํ์ฉ ์์ฝ:
์ด ๋ฌธ์๋ ๋ค์๊ณผ ๊ฐ์ ๋ด์ฉ์ ๋ค๋ฃน๋๋ค:
ํ๊ตญ์ด ์๋ฃ ์์ฐ์ด ์ฒ๋ฆฌ๋ฅผ ์ํ ์ฌ์ ํ๋ จ๋ BERT ๋ชจ๋ธ.
์ด ๋ชจ๋ธ์ ์๋ฃ ๋ถ์ผ์์ ์ฌ์ฉ๋๋ ํ๊ตญ์ด ํ
์คํธ๋ฅผ ๋ถ์ํ๊ธฐ ์ํด KR-BERT ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ๊ตญ์ด ์๋ฃ ์ฝํผ์ค๋ก ์ฌ์ ํ๋ จํ KM-BERT๋ผ๊ณ ํฉ๋๋ค.
์ด ๋ชจ๋ธ์ ์๋ฃ ๊ต๊ณผ์, ๊ฑด๊ฐ ์ ๋ณด ๋ด์ค, ์๋ฃ ์ฐ๊ตฌ ๋
ผ๋ฌธ ๋ฑ ์ธ ๊ฐ์ง ์ ํ์ ๋ฌธ์๋ก ๊ตฌ์ฑ๋ ์ฝ 1์ต 1์ฒ 6๋ฐฑ๋ง ๋จ์ด์ ํ๊ตญ์ด ์๋ฃ ์ฝํผ์ค๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
๋ด๋ถ ํ๊ฐ์ ์ธ๋ถ ํ๊ฐ.
์ด ๋ชจ๋ธ์ MLM๊ณผ NSP๋ผ๋ ๋ ๊ฐ์ง ๋น์ง๋ ์ฌ์ ํ๋ จ ๊ณผ์ ๋ฅผ ์ํํ๊ณ , ์๋ก์ด ํ๊ตญ์ด ์๋ฃ ์ฝํผ์ค์ MedSTS ๋ฐ์ดํฐ์
์ ์ด์ฉํ์ฌ ์ธ์ด ์ดํด ๋ฅ๋ ฅ์ ๋ด๋ถ ํ๊ฐํ์ต๋๋ค.
๋ํ, ํ๊ตญ์ด ์๋ฃ ์๋ฏธ๋ก ์ ํ
์คํธ ์ ์ฌ๋(MedSTS) ๋ฐ์ดํฐ์
๊ณผ ํ๊ตญ์ด ์๋ฃ ๊ฐ์ฒด ์ธ์(NER) ๋ฐ์ดํฐ์
์ ์ด์ฉํ์ฌ ํ๋ฅ ๊ณผ์ ์ ๋ํ ์ฑ๋ฅ์ ์ธ๋ถ ํ๊ฐํ์ต๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก, KM-BERT๋ ๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ๋ค๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
์ธ์ด๋ณ ๋ฐ ๋ถ์ผ๋ณ ๊ด์ .
M-BERT๋ ๋ค์ํ ์ธ์ด์ ๋ํ NLP ๊ณผ์ ์ ๋์ ์ ์ด์ฑ์ ๋ณด์ด์ง๋ง, ์ธ์ด๋ณ BERT ๋ชจ๋ธ๋ค์ด M-BERT๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๋ ๊ฒ์ด ์ฆ๋ช
๋์์ต๋๋ค.
- ํ๊ตญ์ด๋ ์์ด์ ๊ฐ์ ์ธ๋์ ๋ฝ์ด์๋ ๋ค๋ฅธ ๋จ์ด ์์๋ฅผ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์, ํ๊ตญ์ด์ ํนํ๋ BERT ๋ชจ๋ธ์ด ํ์ํฉ๋๋ค.
- ๋ํ, SciBERT๋ LEGAL-BERT์ ๊ฐ์ ๋ถ์ผ๋ณ BERT ์๋ฒ ๋ฉ์ด BERT๋ณด๋ค ์ ๋ฌธ ์ฉ์ด์ ์ฉ๋ฒ์ ๋ํ ์ดํด๋ ฅ์ ํฅ์์ํจ๋ค๋ ๊ฒ์ด ๋ฐํ์ก์ต๋๋ค.
- ์ด๋ฌํ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ค์ ํ๊ตญ์ด ์๋ฃ ๋ถ์ผ์ ์ ํฉํ BERT ๋ชจ๋ธ ๊ฐ๋ฐ์ ํ์์ฑ๊ณผ ํจ๊ณผ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
Model Sources [optional]
- Repository: https://github.com/KU-RIAS/KM-BERT-Korean-Medical-BERT
- Paper: https://www.nature.com/articles/s41598-022-17806-8
Citation [optional]
@article{KMBERT,
title={KM-BERT: A Pre-trained BERT for Korean Medical Natural Language Processing},
author={TBD},
year={TBD},
journal={TBD},
volume={TBD}
}
- Downloads last month
- 577