์ด๋ป๊ฒ ๐ค Transformers ๋ชจ๋ธ์ TensorFlow๋ก ๋ณํํ๋์?
๐ค Transformers์์์ฒ๋ผ ์ฌ์ฉํ ์ ์๋ ์ฌ๋ฌ ๊ฐ์ง ํ๋ ์์ํฌ๊ฐ ์๋ค๋ ๊ฒ์ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ค๊ณํ ๋ ๊ทธ๋ค์ ๊ฐ์ ์ ์ ์ฐํ๊ฒ ์ด์ฉํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ๋ชจ๋ธ ๋ณ๋ก ํธํ์ฑ์ ์ถ๊ฐํด์ผ ํ๋ค๋ ๋จ์ ๋ํ ์กด์ฌํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ข์ ์์์ ๊ธฐ์กด ๋ชจ๋ธ์ TensorFlow ํธํ์ฑ์ ์ถ๊ฐํ๋ ๊ฒ์ด ์ฒ์๋ถํฐ ์๋ก์ด ๋ชจ๋ธ์ ์ถ๊ฐํ๋ ๊ฒ๋ณด๋ค๋ ๊ฐ๋จํ๋ค๋ ๊ฒ์ ๋๋ค!
๋ง์ฝ ๋๊ท๋ชจ TensorFlow ๋ชจ๋ธ์ ๋ ๊น์ด ์ดํดํ๋ ค๊ฑฐ๋, ์คํ ์์ค์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ๋ ค๊ฑฐ๋, ์ ํํ ๋ชจ๋ธ์ Tensorflow๋ฅผ ํ์ฉํ๋ คํ๋ค๋ฉด, ์ด ์๋ด์๋ ์ฌ๋ฌ๋ถ๊ป ๋์์ด ๋ ๊ฒ์ ๋๋ค.
์ด ๊ฐ์ด๋๋ Hugging Face ํ์ ์ต์ํ์ ๊ฐ๋ ์๋์์ ๐ค Transformers์์ ์ฌ์ฉ๋๋ TensorFlow ๋ชจ๋ธ ๊ฐ์ค์น์/๋๋ ์ํคํ ์ฒ๋ฅผ ๊ธฐ์ฌํ ์ ์๋ ์ปค๋ฎค๋ํฐ ๊ตฌ์ฑ์์ธ ์ฌ๋ฌ๋ถ์ ๋์์ผ๋ก ํฉ๋๋ค. ์๋ก์ด ๋ชจ๋ธ์ ์์ฑํ๋ ๊ฒ์ ์ฌ์ด ์ผ์ด ์๋์ง๋ง, ์ด ๊ฐ์ด๋๋ฅผ ํตํด ์กฐ๊ธ ๋ ํ๋ค๊ณ ํจ์ฌ ์ฌ์ด ์์ ์ผ๋ก ๋ง๋ค ์ ์์ต๋๋ค. ๋ชจ๋์ ๊ฒฝํ์ ๋ชจ์ผ๋ ๊ฒ์ ์ด ์์ ์ ์ ์ฐจ์ ์ผ๋ก ๋ ์ฝ๊ฒ ๋ง๋๋ ๋ฐ ๊ต์ฅํ ์ค์ํ๊ธฐ ๋๋ฌธ์, ์ด ๊ฐ์ด๋๋ฅผ ๊ฐ์ ์ํฌ๋งํ ์ ์์ด ๋ ์ค๋ฅด๋ฉด ๊ณต์ ํ์๋๊ฑธ ์ ๊ทน์ ์ผ๋ก ๊ถ์ฅํฉ๋๋ค!
๋ ๊น์ด ์์๋ณด๊ธฐ ์ ์, ๐ค Transformers๋ฅผ ์ฒ์ ์ ํ๋ ๊ฒฝ์ฐ ๋ค์ ์๋ฃ๋ฅผ ํ์ธํ๋ ๊ฒ์ด ์ข์ต๋๋ค:
์ด ๊ฐ์ด๋์ ๋๋จธ์ง ๋ถ๋ถ์์๋ ์๋ก์ด TensorFlow ๋ชจ๋ธ ์ํคํ ์ฒ๋ฅผ ์ถ๊ฐํ๋ ๋ฐ ํ์ํ ๋จ๊ณ, Pytorch๋ฅผ TensorFlow ๋ชจ๋ธ ๊ฐ์ค์น๋ก ๋ณํํ๋ ์ ์ฐจ ๋ฐ ML ํ๋ ์์ํฌ ๊ฐ์ ๋ถ์ผ์น๋ฅผ ํจ์จ์ ์ผ๋ก ๋๋ฒ๊น ํ๋ ๋ฐฉ๋ฒ์ ์๊ฒ ๋ ๊ฒ์ ๋๋ค. ์์ํด๋ด ์๋ค!
์ฌ์ฉํ๋ ค๋ ๋ชจ๋ธ์ด ์ด๋ฏธ ํด๋นํ๋ TensorFlow ์ํคํ ์ฒ๊ฐ ์๋์ง ํ์คํ์ง ์๋์?
์ ํํ ๋ชจ๋ธ(์)์ config.json
์ model_type
ํ๋๋ฅผ ํ์ธํด๋ณด์ธ์. ๐ค Transformers์ ํด๋น ๋ชจ๋ธ ํด๋์๋ โmodeling_tfโ๋ก ์์ํ๋ ํ์ผ์ด ์๋ ๊ฒฝ์ฐ, ํด๋น ๋ชจ๋ธ์๋ ํด๋น TensorFlow ์ํคํ
์ฒ(์)๊ฐ ์๋ค๋ ์๋ฏธ์
๋๋ค.
TensorFlow ๋ชจ๋ธ ์ํคํ ์ฒ ์ฝ๋ ์ถ๊ฐํ๋ ๋จ๊ณ๋ณ ๊ฐ์ด๋
๋๊ท๋ชจ ์ํคํ ์ฒ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ ์ค๊ณํ๋ ๋ฐฉ๋ฒ์๋ ์ฌ๋ฌ๊ฐ์ง๊ฐ ์์ผ๋ฉฐ, ํด๋น ์ค๊ณ๋ฅผ ๊ตฌํํ๋ ๋ฐฉ๋ฒ๋ ์ฌ๋ฌ ๊ฐ์ง์ ๋๋ค. ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ ๐ค Transformers ์ผ๋ฐ ๊ฐ์์์ ์ธ๊ธํ ๋๋ก ์ผ๊ด๋ ์ค๊ณ ์ ํ์ ๋ฐ๋ผ์ผ์ง๋ง ๐ค Transformers๋ฅผ ์ฌ์ฉํ๊ธฐ ํธํ ๊ฒ์ด๋ผ๋ ํ๊ณ ํ ์๊ฒฌ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ฐ๋ฆฌ์ ๊ฒฝํ์ ํตํด TensorFlow ๋ชจ๋ธ์ ์ถ๊ฐํ๋ ๋ฐ ๊ด๋ จ๋ ์ค์ํ ๋ช ๊ฐ์ง ์ฌํญ์ ์๋ ค ๋๋ฆด ์ ์์ต๋๋ค:
- ์ด๋ฏธ ์๋๊ฑธ ๋ค์ ๊ฐ๋ฐํ๋ ค ํ์ง ๋ง์ธ์! ์ต์ํ 2๊ฐ์ ์ด๋ฏธ ๊ตฌํ๋ ๋ชจ๋ธ์ ๋๊ฐ ์ฐธ์กฐํด์ผ ํฉ๋๋ค. ๊ตฌํํ๋ ค๋ ๋ชจ๋ธ๊ณผ ๊ธฐ๋ฅ์ ๋์ผํ Pytorch ๋ชจ๋ธ ํ๋์ ๊ฐ์ ๋ฌธ์ ์ ํ์ ํ๊ณ ์๋ ๋ค๋ฅธ TensorFlow ๋ชจ๋ธ ํ๋๋ฅผ ์ดํด๋ณด์ธ์.
- ์ฐ์ํ ๋ชจ๋ธ ๊ตฌํ์ ์๊ฐ์ด ์ง๋๋ ๋จ์์์ต๋๋ค. ์ด๊ฒ์ ์ฝ๋๊ฐ ์๋ฆ๋ต๋ค๋ ์ด์ ๊ฐ ์๋๋ผ ์ฝ๋๊ฐ ๋ช ํํ๊ณ ๋๋ฒ๊น ๋ฐ ๊ฐ์ ์ด ์ฝ๊ธฐ ๋๋ฌธ์ ๋๋ค. TensorFlow ๊ตฌํ์์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ํจํด์ ๋๊ฐ์ด ํ๊ณ Pytorch ๊ตฌํ๊ณผ์ ๋ถ์ผ์น๋ฅผ ์ต์ํํ์ฌ ๋ฉ์ธํ ์ด๋์ ์ ๋ฌด๋ฅผ ์ฝ๊ฒ ํ๋ค๋ฉด, ๊ธฐ์ฌํ ์ฝ๋๊ฐ ์ค๋๋๋ก ์ ์ง๋ ์ ์์ต๋๋ค.
- ํ์ํ๋ค๋ฉด ๋์์ ์์ฒญํ์ธ์! ๐ค Transformers ํ์ ์ฌ๋ฌ๋ถ์ ๋๊ธฐ ์ํด ์์ผ๋ฉฐ, ์ฌ๋ฌ๋ถ์ด ์ง๋ฉดํ ๋์ผํ ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ์ฑ ์ ์ด๋ฏธ ์ฐพ์ ๊ฒฝ์ฐ๋ ์์ ์ ์์ต๋๋ค.
TensorFlow ๋ชจ๋ธ ์ํคํ ์ฒ๋ฅผ ์ถ๊ฐํ๋ ๋ฐ ํ์ํ ๋จ๊ณ๋ฅผ ๊ฐ๋ต์ ์ผ๋ก ์จ๋ณด๋ฉด:
- ๋ณํํ๋ ค๋ ๋ชจ๋ธ ์ ํ
- transformers ๊ฐ๋ฐ ํ๊ฒฝ ์ค๋น
- (์ ํ ์ฌํญ) ์ด๋ก ์ ์ธก๋ฉด ๋ฐ ๊ธฐ์กด ๊ตฌํ ์ดํด
- ๋ชจ๋ธ ์ํคํ ์ฒ ๊ตฌํ
- ๋ชจ๋ธ ํ ์คํธ ๊ตฌํ
- PR (pull request) ์ ์ถ
- (์ ํ ์ฌํญ) ๋ฐ๋ชจ ๋น๋ ๋ฐ ๊ณต์
1.-3. ๋ชจ๋ธ ๊ธฐ์ฌ ์ค๋น
1. ๋ณํํ๋ ค๋ ๋ชจ๋ธ ์ ํ
์ฐ์ ๊ธฐ๋ณธ ์ฌํญ๋ถํฐ ์์ํด ๋ณด๊ฒ ์ต๋๋ค. ๋จผ์ ๋ณํํ๋ ค๋ ์ํคํ ์ฒ๋ฅผ ์์์ผ ํฉ๋๋ค. ํน์ ์ํคํ ์ฒ์ ๋ํ ๊ด์ฌ ์๋ ๊ฒฝ์ฐ, ๐ค Transformers ํ์๊ฒ ์ ์์ ์์ฒญํ๋ ๊ฒ์ ์ฌ๋ฌ๋ถ์ ์ํฅ๋ ฅ์ ๊ทน๋ํํ๋ ์ข์ ๋ฐฉ๋ฒ์ ๋๋ค. ์ฐ๋ฆฌ๋ TensorFlow์์ ๋น ์ ธ ์๋ ๊ฐ์ฅ ์ ๋ช ํ ์ํคํ ์ฒ๋ก ์ด๋์ด ๋๋ฆฌ๊ฒ ์ต๋๋ค. TensorFlow์์ ์ฌ์ฉํ ๋ชจ๋ธ์ด ์ด๋ฏธ ๐ค Transformers์ TensorFlow ์ํคํ ์ฒ ๊ตฌํ์ด ์์ง๋ง ๊ฐ์ค์น๊ฐ ์๋ ๊ฒฝ์ฐ, ์ด ํ์ด์ง์ ๊ฐ์ค์น ์ถ๊ฐ ์น์ ์ผ๋ก ๋ฐ๋ก ์ด๋ํ์ ๋ ๋ฉ๋๋ค.
๊ฐ๋จํ ๋งํด์, ์ด ์๋ด์์ ๋๋จธ์ง ๋ถ๋ถ์ TensorFlow ๋ฒ์ ์ BrandNewBert(๊ฐ์ด๋์ ๋์ผํ ์์ )๋ฅผ ๊ธฐ์ฌํ๋ ค๊ณ ๊ฒฐ์ ํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ์ ์์
์ ์์ํ๊ธฐ ์ ์ ํด๋น ์์
์ด ์งํ ์ค์ธ์ง ํ์ธํ์ธ์.
BrandNewBert
๋ฅผ ๊ฒ์ํ์ฌ
pull request GitHub ํ์ด์ง์์ TensorFlow ๊ด๋ จ pull request๊ฐ ์๋์ง ํ์ธํ ์ ์์ต๋๋ค.
2. transformers ๊ฐ๋ฐ ํ๊ฒฝ ์ค๋น
๋ชจ๋ธ ์ํคํ ์ฒ๋ฅผ ์ ํํ ํ, ๊ด๋ จ ์์ ์ ์ํํ ์๋๋ฅผ ๋ฏธ๋ฆฌ ์๋ฆฌ๊ธฐ ์ํด Draft PR์ ์ฌ์ธ์. ์๋ ์ง์นจ๋๋ก ํ์๋ฉด ํ๊ฒฝ์ ์ค์ ํ๊ณ Draft PR์ ์ด ์ ์์ต๋๋ค.
- โForkโ ๋ฒํผ์ ํด๋ฆญํ์ฌ ๋ฆฌํฌ์งํฐ๋ฆฌ๋ฅผ ํฌํฌํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด GitHub ์ฌ์ฉ์ ๊ณ์ ์ ์ฝ๋์ ์ฌ๋ณธ์ด ์์ฑ๋ฉ๋๋ค.
transformers
ํฌํฌ๋ฅผ ๋ก์ปฌ ๋์คํฌ์ ํด๋ก ํ๊ณ ์๋ณธ ๋ฆฌํฌ์งํฐ๋ฆฌ๋ฅผ ์๊ฒฉ ๋ฆฌํฌ์งํฐ๋ฆฌ๋ก ์ถ๊ฐํ์ธ์.
git clone https://github.com/[your Github handle]/transformers.git
cd transformers
git remote add upstream https://github.com/huggingface/transformers.git
- ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ์ธ์. ์๋ฅผ ๋ค์ด, ๋ค์ ๋ช ๋ น์ ์คํํ์ฌ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ ์ ์์ต๋๋ค.
python -m venv .env
source .env/bin/activate
pip install -e ".[dev]"
์ด์ ์ฒด์ ์ ๋ฐ๋ผ์ Transformers์ ์ ํ์ ์ข ์์ฑ์ด ์ฆ๊ฐํ๋ฉด์ ์ ๋ช ๋ น์ด ์คํจํ ์๋ ์์ต๋๋ค. ๊ทธ๋ฐ ๊ฒฝ์ฐ TensorFlow๋ฅผ ์ค์นํ ํ ๋ค์์ ์คํํ์ธ์.
pip install -e ".[quality]"
์ฐธ๊ณ : CUDA๋ฅผ ์ค์นํ ํ์๋ ์์ต๋๋ค. ์๋ก์ด ๋ชจ๋ธ์ด CPU์์ ์๋ํ๋๋ก ๋ง๋๋ ๊ฒ๋ง์ผ๋ก ์ถฉ๋ถํฉ๋๋ค.
- ๋ฉ์ธ ๋ธ๋์น์์ ๋ง๋๋ ค๋ ๊ธฐ๋ฅ์ด ์ ํํ๋๋ ์ด๋ฆ์ผ๋ก ๋ธ๋์น๋ฅผ ๋ง๋ญ๋๋ค.
git checkout -b add_tf_brand_new_bert
- ๋ฉ์ธ ๋ธ๋์น์ ํ์ฌ ์ํ๋ฅผ ํ์น(fetch)ํ๊ณ ๋ฆฌ๋ฒ ์ด์คํ์ธ์.
git fetch upstream git rebase upstream/main
transformers/src/models/brandnewbert/
์modeling_tf_brandnewbert.py
๋ผ๋ ๋น.py
ํ์ผ์ ์ถ๊ฐํ์ธ์. ์ด ํ์ผ์ด TensorFlow ๋ชจ๋ธ ํ์ผ์ด ๋ ๊ฒ์ ๋๋ค.๋ณ๊ฒฝ ์ฌํญ์ ๊ณ์ ์ ํธ์ํ์ธ์.
git add .
git commit -m "initial commit"
git push -u origin add_tf_brand_new_bert
- ๋ง์กฑ์ค๋ฌ์ด ๊ฒฝ์ฐ GitHub์์ ํฌํฌ๋ ์น ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค. โPull requestโ๋ฅผ ํด๋ฆญํฉ๋๋ค. Hugging Face ํ์ GitHub ID๋ฅผ ๋ฆฌ๋ทฐ์ด๋ก ์ถ๊ฐํด์, ์์ผ๋ก์ ๋ณ๊ฒฝ ์ฌํญ์ ๋ํด Hugging Face ํ์ด ์๋ฆผ์ ๋ฐ์ ์ ์๋๋ก ํฉ๋๋ค.
- GitHub Pull Requests ํ์ด์ง์ ์ค๋ฅธ์ชฝ์ ์๋ โConvert to draftโ๋ฅผ ํด๋ฆญํ์ฌ PR์ ์ด์์ผ๋ก ๋ณ๊ฒฝํ์ธ์.
์ด์ ๐ค Transformers์์ BrandNewBert๋ฅผ TensorFlow๋ก ๋ณํํ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ์ต๋๋ค.
3. (์ ํ ์ฌํญ) ์ด๋ก ์ ์ธก๋ฉด ๋ฐ ๊ธฐ์กด ๊ตฌํ ์ดํด
BrandNewBert์ฒ๋ผ ์์ธํ ๊ธ์ด ์๋ค๋ฉด ์๊ฐ์ ๋ด์ด ๋ ผ๋ฌธ์ ์ฝ๋๊ฑธ ์ถ์ฒ๋๋ฆฝ๋๋ค. ์ดํดํ๊ธฐ ์ด๋ ค์ด ๋ถ๋ถ์ด ๋ง์ ์ ์์ต๋๋ค. ๊ทธ๋ ๋ค๊ณ ํด์ ๊ฑฑ์ ํ์ง ๋ง์ธ์! ๋ชฉํ๋ ๋ ผ๋ฌธ์ ์ฌ๋์๋ ์ด๋ก ์ ์ดํด๊ฐ ์๋๋ผ TensorFlow๋ฅผ ์ฌ์ฉํ์ฌ ๐ค Transformers์ ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ๋ค์ ๊ตฌํํ๋ ๋ฐ ํ์ํ ํ์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๊ฒ์ ๋๋ค. ๋ง์ ์๊ฐ์ ์ด๋ก ์ ์ดํด์ ํฌ์ํ ํ์๋ ์์ง๋ง ์ค์ฉ์ ์ธ ์ธก๋ฉด์์ ํ์ฌ ์กด์ฌํ๋ ๋ชจ๋ธ ๋ฌธ์ ํ์ด์ง(e.g. model docs for BERT)์ ์ง์คํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
๋ชจ๋ธ์ ๊ธฐ๋ณธ ์ฌํญ์ ์ดํดํ ํ, ๊ธฐ์กด ๊ตฌํ์ ์ดํดํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ์ด๋ ์์ ์ค์ธ ๋ชจ๋ธ์ ๋ํ ์ค์ ๊ตฌํ์ด ์ฌ๋ฌ๋ถ์ ๊ธฐ๋์ ์ผ์นํจ์ ํ์ธํ๊ณ , TensorFlow ์ธก๋ฉด์์์ ๊ธฐ์ ์ ๋ฌธ์ ๋ฅผ ์์ํ ์ ์์ต๋๋ค.
๋ง๋ํ ์์ ์ ๋ณด๋ฅผ ์ฒ์์ผ๋ก ํ์ตํ ๋ ์๋๋นํ๋ ๊ฒ์ ์์ฐ์ค๋ฌ์ด ์ผ์ ๋๋ค. ์ด ๋จ๊ณ์์ ๋ชจ๋ธ์ ๋ชจ๋ ์ธก๋ฉด์ ์ดํดํด์ผ ํ๋ ํ์๋ ์ ํ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ Hugging Face์ ํฌ๋ผ์ ํตํด ์ง๋ฌธ์ด ์๋ ๊ฒฝ์ฐ ๋๋ต์ ๊ตฌํ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค.
4. ๋ชจ๋ธ ๊ตฌํ
์ด์ ๋๋์ด ์ฝ๋ฉ์ ์์ํ ์๊ฐ์
๋๋ค. ์ฐ๋ฆฌ์ ์ ์๋ ์์์ ์ PyTorch ํ์ผ ์์ฒด์
๋๋ค: modeling_brand_new_bert.py
์ ๋ด์ฉ์
src/transformers/models/brand_new_bert/
๋ด๋ถ์
modeling_tf_brand_new_bert.py
์ ๋ณต์ฌํฉ๋๋ค. ์ด ์น์
์ ๋ชฉํ๋ ํ์ผ์ ์์ ํ๊ณ ๐ค Transformers์ import ๊ตฌ์กฐ๋ฅผ ์
๋ฐ์ดํธํ์ฌ TFBrandNewBert
๋ฐ TFBrandNewBert.from_pretrained(model_repo, from_pt=True)
๊ฐ ์ฑ๊ณต์ ์ผ๋ก ์๋ํ๋ TensorFlow BrandNewBert ๋ชจ๋ธ์ ๊ฐ์ ธ์ฌ ์ ์๋๋ก ํ๋ ๊ฒ์
๋๋ค.
์ ๊ฐ์ค๋ฝ๊ฒ๋, PyTorch ๋ชจ๋ธ์ TensorFlow๋ก ๋ณํํ๋ ๊ท์น์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ํ๋ก์ธ์ค๋ฅผ ๊ฐ๋ฅํํ ์ํํ๊ฒ ๋ง๋ค๊ธฐ ์ํด ๋ค์ ํ์ ๋ฐ๋ฅผ ์ ์์ต๋๋ค.
- ๋ชจ๋ ํด๋์ค ์ด๋ฆ ์์
TF
๋ฅผ ๋ถ์ ๋๋ค(์:BrandNewBert
๋TFBrandNewBert
๊ฐ ๋ฉ๋๋ค). - ๋๋ถ๋ถ์ PyTorch ์์
์๋ ์ง์ ์ ์ธ TensorFlow ๋์ฒด๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด,
torch.nn.Linear
๋tf.keras.layers.Dense
์ ํด๋นํ๊ณ ,torch.nn.Dropout
์tf.keras.layers.Dropout
์ ํด๋นํฉ๋๋ค. ํน์ ์์ ์ ๋ํด ํ์ ์ด ์๋ ๊ฒฝ์ฐ TensorFlow ๋ฌธ์๋ PyTorch ๋ฌธ์๋ฅผ ์ฐธ์กฐํ ์ ์์ต๋๋ค. - ๐ค Transformers ์ฝ๋๋ฒ ์ด์ค์์ ํจํด์ ์ฐพ์ผ์ธ์. ์ง์ ์ ์ธ ๋์ฒด๊ฐ ์๋ ํน์ ์์ ์ ๋ง๋๋ฉด ๋ค๋ฅธ ์ฌ๋์ด ์ด๋ฏธ ๋์ผํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
- ๊ธฐ๋ณธ์ ์ผ๋ก PyTorch์ ๋์ผํ ๋ณ์ ์ด๋ฆ๊ณผ ๊ตฌ์กฐ๋ฅผ ์ ์งํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด ๋๋ฒ๊น ๊ณผ ๋ฌธ์ ์ถ์ , ๊ทธ๋ฆฌ๊ณ ๋ฌธ์ ํด๊ฒฐ ์ถ๊ฐ๊ฐ ๋ ์ฌ์์ง๋๋ค.
- ์ผ๋ถ ๋ ์ด์ด๋ ๊ฐ ํ๋ ์์ํฌ๋ง๋ค ๋ค๋ฅธ ๊ธฐ๋ณธ๊ฐ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋ํ์ ์ธ ์๋ก ๋ฐฐ์น ์ ๊ทํ ๋ ์ด์ด์ epsilon์ PyTorch์์
1e-5
์ด๊ณ TensorFlow์์1e-3
์ ๋๋ค. ๋ฌธ์๋ฅผ ๋ชจ๋ ํ์ธํ์ธ์! - PyTorch์
nn.Parameter
๋ณ์๋ ์ผ๋ฐ์ ์ผ๋ก TF ๋ ์ด์ด์build()
๋ด์์ ์ด๊ธฐํํด์ผ ํฉ๋๋ค. ๋ค์ ์๋ฅผ ์ฐธ์กฐํ์ธ์: PyTorch / TensorFlow - PyTorch ๋ชจ๋ธ์ ํจ์ ์๋จ์
#copied from ...
๊ฐ ์๋ ๊ฒฝ์ฐ, TensorFlow ๋ชจ๋ธ์ TensorFlow ์ํคํ ์ฒ๊ฐ ์๋ค๋ฉด TensorFlow ๋ชจ๋ธ์ด ํด๋น ํจ์๋ฅผ ๋ณต์ฌํ ์ํคํ ์ฒ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค. - TensorFlow ํจ์์์
name
์์ฑ์ ์ฌ๋ฐ๋ฅด๊ฒ ํ ๋นํ๋ ๊ฒ์from_pt=True
๊ฐ์ค์น ๊ต์ฐจ ๋ก๋ฉ์ ์ํํ๋ ๋ฐ ์ค์ํฉ๋๋ค.name
์ ๋๋ถ๋ถ PyTorch ์ฝ๋์ ํด๋น ๋ณ์์ ์ด๋ฆ์ ๋๋ค.name
์ด ์ ๋๋ก ์ค์ ๋์ง ์์ผ๋ฉด ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ก๋ํ ๋ ์ค๋ฅ ๋ฉ์์ง์์ ํ์ธํ ์ ์์ต๋๋ค. - ๊ธฐ๋ณธ ๋ชจ๋ธ ํด๋์ค์ธ
BrandNewBertModel
์ ๋ก์ง์ ์ค์ ๋ก Keras ๋ ์ด์ด ์๋ธํด๋์ค(์์)์ธTFBrandNewBertMainLayer
์ ์์ต๋๋ค.TFBrandNewBertModel
์ ์ด ๋ ์ด์ด๋ฅผ ๊ฐ์ธ๊ธฐ๋ง ํ๋ ๋ํผ ์ญํ ์ ํฉ๋๋ค. - Keras ๋ชจ๋ธ์ ์ฌ์ ํ๋ จ๋ ๊ฐ์ค์น๋ฅผ ๋ก๋ํ๊ธฐ ์ํด ๋น๋๋์ด์ผ ํฉ๋๋ค. ๋ฐ๋ผ์
TFBrandNewBertPreTrainedModel
์ ๋ชจ๋ธ์ ์ ๋ ฅ ์์ ์ธdummy_inputs
(์์) ์ ์งํด์ผ ํฉ๋๋ค. - ๋์์ด ํ์ํ ๊ฒฝ์ฐ ๋์์ ์์ฒญํ์ธ์. ์ฐ๋ฆฌ๋ ์ฌ๊ธฐ ์์ด์ ๋์์ ๋๋ฆฌ๊ธฐ ์ํด ์๋ ๊ฒ์ ๋๋ค! ๐ค
๋ชจ๋ธ ํ์ผ ์์ฒด ์ธ์๋ ๋ชจ๋ธ ํด๋์ค ๋ฐ ๊ด๋ จ ๋ฌธ์ ํ์ด์ง์ ๋ํ ํฌ์ธํฐ๋ฅผ ์ถ๊ฐํด์ผ ํฉ๋๋ค. ์ด ๋ถ๋ถ์ ๋ค๋ฅธ PR(์์)์ ํจํด์ ๋ฐ๋ผ ์์ ํ ์๋ฃํ ์ ์์ต๋๋ค. ๋ค์์ ํ์ํ ์๋ ๋ณ๊ฒฝ ๋ชฉ๋ก์ ๋๋ค.
src/transformers/__init__.py
์ BrandNewBert์ ๋ชจ๋ ๊ณต๊ฐ ํด๋์ค๋ฅผ ํฌํจํฉ๋๋ค.src/transformers/models/auto/modeling_tf_auto.py
์์ BrandNewBert ํด๋์ค๋ฅผ ํด๋น Auto ํด๋์ค์ ์ถ๊ฐํฉ๋๋ค.utils/documentation_tests.txt
์ ๋ชจ๋ธ ํ์ผ์ ๋ฌธ์ํํ๋ ํ ์คํธ ํ์ผ ๋ชฉ๋ก์ ์ถ๊ฐํฉ๋๋ค.src/transformers/utils/dummy_tf_objects.py
์ BrandNewBert์ ๊ด๋ จ๋ ๋ ์ด์ง ๋ก๋ฉ ํด๋์ค๋ฅผ ์ถ๊ฐํฉ๋๋ค.src/transformers/models/brand_new_bert/__init__.py
์์ ๊ณต๊ฐ ํด๋์ค์ ๋ํ import ๊ตฌ์กฐ๋ฅผ ์ ๋ฐ์ดํธํฉ๋๋ค.docs/source/en/model_doc/brand_new_bert.md
์์ BrandNewBert์ ๊ณต๊ฐ ๋ฉ์๋์ ๋ํ ๋ฌธ์ ํฌ์ธํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.docs/source/en/model_doc/brand_new_bert.md
์ BrandNewBert ๊ธฐ์ฌ์ ๋ชฉ๋ก์ ์์ ์ ์ถ๊ฐํฉ๋๋ค.- ๋ง์ง๋ง์ผ๋ก โ ๋ น์ ์ฒดํฌ๋ฐ์ค๋ฅผ TensorFlow ์ด docs/source/en/index.md ์ BrandNewBert์ ์ถ๊ฐํฉ๋๋ค.
๊ตฌํ์ด ๋ง์กฑํ๋ฉด ๋ค์ ์ฒดํฌ๋ฆฌ์คํธ๋ฅผ ์คํํ์ฌ ๋ชจ๋ธ ์ํคํ ์ฒ๊ฐ ์ค๋น๋์๋์ง ํ์ธํ์ธ์.
- ํ๋ จ ์๊ฐ์ ๋ค๋ฅด๊ฒ ๋์ํ๋
training
์ธ์๋ก ๋ถ๋ฆฌ๋ ๋ชจ๋ ๋ ์ด์ด(์: Dropout)๋ ์ต์์ ํด๋์ค์์ ์ ํ๋ฉ๋๋ค. - #copied from โฆ๊ฐ๋ฅํ ๋๋ง๋ค ์ฌ์ฉํ์ต๋๋ค.
TFBrandNewBertMainLayer
์ ๊ทธ๊ฒ์ ์ฌ์ฉํ๋ ๋ชจ๋ ํด๋์ค๋call
ํจ์๋ก@unpack_inputs
์ ํจ๊ป ๋ฐ์ฝ๋ ์ดํฐ ๋ฉ๋๋ค.TFBrandNewBertMainLayer
๋@keras_serializable
๋ก ๋ฐ์ฝ๋ ์ดํฐ ๋ฉ๋๋ค.- TensorFlow ๋ชจ๋ธ์
TFBrandNewBert.from_pretrained(model_repo, from_pt=True)
๋ฅผ ์ฌ์ฉํ์ฌ PyTorch ๊ฐ์ค์น์์ ๋ก๋ํ ์ ์์ต๋๋ค. - ์์ ์ ๋ ฅ ํ์์ ์ฌ์ฉํ์ฌ TensorFlow ๋ชจ๋ธ์ ํธ์ถํ ์ ์์ต๋๋ค.
5. ๋ชจ๋ธ ํ ์คํธ ๊ตฌํ
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ๊ตฌํํ๋ ๋ฐ ์ฑ๊ณตํ์ต๋๋ค! ์ด์ TensorFlow ๋ชจ๋ธ์ ํ
์คํธํ๋ ๊ตฌํ์ ์์ฑํ ์ฐจ๋ก์
๋๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด ์์๋๋ก ์๋ํ๋์ง ํ์ธํ ์ ์์ต๋๋ค. ์ด์ ์ ์ฐ๋ฆฌ๋ test_modeling_brand_new_bert.py
ํ์ผ์ tests/models/brand_new_bert/ into test_modeling_tf_brand_new_bert.py
์ ๋ณต์ฌํ ๋ค, TensorFlow๋ก ๊ต์ฒดํ๋ ๊ฒ์ด ์ข์ต๋๋ค. ์ง๊ธ์, ๋ชจ๋ .from_pretrained()
์ from_pt=True
๋ฅผ ์ฌ์ฉํ์ฌ ์กด์ฌํ๋ Pytorch ๊ฐ์ค์น๋ฅผ ๊ฐ์ ธ์ค๋๋ก ํด์ผํฉ๋๋ค.
์๋ฃํ์ จ์ผ๋ฉด, ์ด์ ์ง์ค์ ์๊ฐ์ด ์ฐพ์์์ต๋๋ค: ํ ์คํธ๋ฅผ ์คํํด ๋ณด์ธ์! ๐ฌ
NVIDIA_TF32_OVERRIDE=0 RUN_SLOW=1 RUN_PT_TF_CROSS_TESTS=1 \ py.test -vv tests/models/brand_new_bert/test_modeling_tf_brand_new_bert.py
์ค๋ฅ๊ฐ ๋ง์ด ๋ํ๋ ๊ฒ์ด์ง๋ง ๊ด์ฐฎ์ต๋๋ค! ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ๋๋ฒ๊น
ํ๋ ๊ฒ์ ์
๋ช
๋๊ฒ ์ด๋ ค์ฐ๋ฉฐ ์ฑ๊ณต์ ํต์ฌ ์์๋ ์ธ๋ด์ฌ์
๋๋ค (breakpoint()
๋ ํ์ํฉ๋๋ค). ์ฐ๋ฆฌ์ ๊ฒฝํ์์ผ๋ก๋ ML ํ๋ ์์ํฌ ์ฌ์ด์ ๋ฏธ๋ฌํ ๋ถ์ผ์น๋ก ์ธํด ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ ๊ฐ ๋ฐ์ํฉ๋๋ค. ์ด์ ๋ํ ๋ช ๊ฐ์ง ์ง์นจ์ด ์ด ๊ฐ์ด๋์ ๋ ๋ถ๋ถ์ ์์ต๋๋ค. ๋ค๋ฅธ ๊ฒฝ์ฐ์๋ ์ผ๋ฐ ํ
์คํธ๊ฐ ์ง์ ๋ชจ๋ธ์ ์ ์ฉ๋์ง ์์ ์ ์์ผ๋ฉฐ, ์ด ๊ฒฝ์ฐ ๋ชจ๋ธ ํ
์คํธ ํด๋์ค ๋ ๋ฒจ์์ ์ฌ์ ์๋ฅผ ์ ์ํฉ๋๋ค. ๋ฌธ์ ๊ฐ ๋ฌด์์ด๋ ์ง ์๊ด์์ด ๋ฌธ์ ๊ฐ ์์ผ๋ฉด ๋น์ ์ด ๊ณ ๋ฆฝ๋์๋ค๋ฉด draft pull request์์ ๋์์ ์์ฒญํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
๋ชจ๋ ํ ์คํธ๊ฐ ํต๊ณผ๋๋ฉด ์ถํํฉ๋๋ค. ์ด์ ๋ชจ๋ธ์ ๐ค Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ถ๊ฐํ ์ค๋น๊ฐ ๊ฑฐ์ ์๋ฃ๋ ๊ฒ์ ๋๋ค! ๐
ํ ์คํธ๋ฅผ ์ถ๊ฐํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ธํ ๋ด์ฉ์ ๐ค Transformers์ ํ ์คํธ ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ธ์.
6.-7. ๋ชจ๋ ์ฌ์ฉ์๊ฐ ๋น์ ์ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๊ฒ ํ๊ธฐ
6. ํ ์์ฒญ ์ ์ถํ๊ธฐ
๊ตฌํ๊ณผ ํ
์คํธ๊ฐ ์๋ฃ๋๋ฉด ํ ์์ฒญ์ ์ ์ถํ ์๊ฐ์
๋๋ค. ์ฝ๋๋ฅผ ํธ์ํ๊ธฐ ์ ์ ์ฝ๋ ์์ ๋ง์ถ๊ธฐ ์ ํธ๋ฆฌํฐ์ธ make fixup
๐ช ๋ฅผ ์คํํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด ์๋์ผ๋ก ์์ ์ค๋ฅ๋ฅผ ์์ ํ๋ฉฐ ์๋ ๊ฒ์ฌ๊ฐ ์คํจํ๋ ๊ฒ์ ๋ฐฉ์งํ ์ ์์ต๋๋ค.
์ด์ ๋๋ํํธ ํ ์์ฒญ์ ์ค์ ํ ์์ฒญ์ผ๋ก ๋ณํํ๋ ์๊ฐ์
๋๋ค. โ๋ฆฌ๋ทฐ ์ค๋น๋จโ ๋ฒํผ์ ํด๋ฆญํ๊ณ Joao (@gante
)์ Matt (@Rocketknight1
)๋ฅผ ๋ฆฌ๋ทฐ์ด๋ก ์ถ๊ฐํ์ธ์. ๋ชจ๋ธ ํ ์์ฒญ์๋ ์ ์ด๋ 3๋ช
์ ๋ฆฌ๋ทฐ์ด๊ฐ ํ์ํ์ง๋ง, ๊ทธ๋ค์ด ๋น์ ์ ๋ชจ๋ธ์ ์ ์ ํ ์ถ๊ฐ ๋ฆฌ๋ทฐ์ด๋ฅผ ์ฐพ์ ๊ฒ์
๋๋ค.
๋ชจ๋ ๋ฆฌ๋ทฐ์ด๋ค์ด PR ์ํ์ ๋ง์กฑํ๋ฉด ๋ง์ง๋ง์ผ๋ก .from_pretrained()
ํธ์ถ์์ from_pt=True
ํ๋๊ทธ๋ฅผ ์ ๊ฑฐํ๋ ๊ฒ์
๋๋ค. TensorFlow ๊ฐ์ค์น๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ์ถ๊ฐํด์ผ ํฉ๋๋ค! ์ด๋ฅผ ์ํํ๋ ๋ฐฉ๋ฒ์ ์๋ ์น์
์ ์ง์นจ์ ํ์ธํ์ธ์.
๋ง์นจ๋ด TensorFlow ๊ฐ์ค์น๊ฐ ๋ณํฉ๋๊ณ , ์ ์ด๋ 3๋ช ์ ๋ฆฌ๋ทฐ์ด ์น์ธ์ ๋ฐ์์ผ๋ฉฐ ๋ชจ๋ CI ๊ฒ์ฌ๊ฐ ํต๊ณผ๋์๋ค๋ฉด, ๋ก์ปฌ๋ก ํ ์คํธ๋ฅผ ํ ๋ฒ ๋ ํ์ธํ์ธ์.
NVIDIA_TF32_OVERRIDE=0 RUN_SLOW=1 RUN_PT_TF_CROSS_TESTS=1 \ py.test -vv tests/models/brand_new_bert/test_modeling_tf_brand_new_bert.py
๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ ๋น์ ์ PR์ ๋ณํฉํ ๊ฒ์ ๋๋ค! ๋ง์ผ์คํค ๋ฌ์ฑ์ ์ถํ๋๋ฆฝ๋๋ค! ๐
7. (์ ํ ์ฌํญ) ๋ฐ๋ชจ๋ฅผ ๋ง๋ค๊ณ ์ธ์๊ณผ ๊ณต์ ํ๊ธฐ
์คํ ์์ค์ ๊ฐ์ฅ ์ด๋ ค์ด ๋ถ๋ถ ์ค ํ๋๋ ๋ฐ๊ฒฌ์ ๋๋ค. ๋ค๋ฅธ ์ฌ์ฉ์๋ค์ด ๋น์ ์ ๋ฉ์ง TensorFlow ๊ธฐ์ฌ๋ฅผ ์ด๋ป๊ฒ ์ ์ ์์๊น์? ๋ฌผ๋ก ์ ์ ํ ์ปค๋ฎค๋์ผ์ด์ ์ผ๋ก ๊ฐ๋ฅํฉ๋๋ค! ๐ฃ
์ปค๋ฎค๋ํฐ์ ๋ชจ๋ธ์ ๊ณต์ ํ๋ ๋ ๊ฐ์ง ์ฃผ์ ๋ฐฉ๋ฒ์ด ์์ต๋๋ค:
- ๋ฐ๋ชจ ๋ง๋ค๊ธฐ. Gradio ๋ฐ๋ชจ, ๋ ธํธ๋ถ ๋ฐ ๋ชจ๋ธ์ ์๋ํ๋ ๋ค๋ฅธ ์ฌ๋ฏธ์๋ ๋ฐฉ๋ฒ์ ํฌํจํฉ๋๋ค. ์ปค๋ฎค๋ํฐ ๊ธฐ๋ฐ ๋ฐ๋ชจ์ ๋ ธํธ๋ถ์ ์ถ๊ฐํ๋ ๊ฒ์ ์ ๊ทน ๊ถ์ฅํฉ๋๋ค.
- Twitter์ LinkedIn๊ณผ ๊ฐ์ ์์ ๋ฏธ๋์ด์ ์ด์ผ๊ธฐ ๊ณต์ ํ๊ธฐ. ๋น์ ์ ์์ ์ ์๋์ค๋ฌ์ํ๊ณ ์ปค๋ฎค๋ํฐ์ ๋น์ ์ ์ ์ ์ ๊ณต์ ํด์ผ ํฉ๋๋ค. ์ด์ ๋น์ ์ ๋ชจ๋ธ์ ์ ์ธ๊ณ์ ์์ฒ ๋ช ์ ์์ง๋์ด์ ์ฐ๊ตฌ์๋ค์ ์ํด ์ฌ์ฉ๋ ์ ์์ต๋๋ค ๐! ์ฐ๋ฆฌ๋ ๋น์ ์ ๊ฒ์๋ฌผ์ ๋ฆฌํธ์ํ๊ณ ์ปค๋ฎค๋ํฐ์ ํจ๊ป ๋น์ ์ ์์ ์ ๊ณต์ ํ๋ ๋ฐ ๋์์ด ๋ ๊ฒ์ ๋๋ค.
๐ค ํ๋ธ์ TensorFlow ๊ฐ์ค์น ์ถ๊ฐํ๊ธฐ
TensorFlow ๋ชจ๋ธ ์ํคํ ์ฒ๊ฐ ๐ค Transformers์์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค๊ณ ๊ฐ์ ํ๊ณ , PyTorch ๊ฐ์ค์น๋ฅผ TensorFlow ๊ฐ์ค์น๋ก ๋ณํํ๋ ๊ฒ์ ์ฝ์ต๋๋ค!
๋ค์์ ๊ทธ ๋ฐฉ๋ฒ์ ๋๋ค:
- ํฐ๋ฏธ๋์์ Hugging Face ๊ณ์ ์ผ๋ก ๋ก๊ทธ์ธ๋์ด ์๋์ง ํ์ธํ์ญ์์ค.
huggingface-cli login
๋ช ๋ น์ด๋ฅผ ์ฌ์ฉํ์ฌ ๋ก๊ทธ์ธํ ์ ์์ต๋๋ค. (์ก์ธ์ค ํ ํฐ์ ์ฌ๊ธฐ์์ ์ฐพ์ ์ ์์ต๋๋ค.) transformers-cli pt-to-tf --model-name foo/bar
๋ฅผ ์คํํ์ญ์์ค. ์ฌ๊ธฐ์foo/bar
๋ ๋ณํํ๋ ค๋ PyTorch ๊ฐ์ค์น๊ฐ ์๋ ๋ชจ๋ธ ์ ์ฅ์์ ์ด๋ฆ์ ๋๋ค.- ๋ฐฉ๊ธ ๋ง๋ ๐ค ํ๋ธ PR์์
@joaogante
์@Rocketknight1
์ ํ๊ทธํฉ๋๋ค.
๊ทธ๊ฒ ๋ค์ ๋๋ค! ๐
ML ํ๋ ์์ํฌ ๊ฐ ๋๋ฒ๊น ๐
์๋ก์ด ์ํคํ ์ฒ๋ฅผ ์ถ๊ฐํ๊ฑฐ๋ ๊ธฐ์กด ์ํคํ ์ฒ์ ๋ํ TensorFlow ๊ฐ์ค์น๋ฅผ ์์ฑํ ๋, PyTorch์ TensorFlow ๊ฐ์ ๋ถ์ผ์น๋ก ์ธํ ์ค๋ฅ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. ์ฌ์ง์ด ๋ ํ๋ ์์ํฌ์ ๋ชจ๋ธ ์ํคํ ์ฒ ์ฝ๋๊ฐ ๋์ผํด ๋ณด์ผ ์๋ ์์ต๋๋ค. ๋ฌด์จ ์ผ์ด ๋ฒ์ด์ง๊ณ ์๋ ๊ฑธ๊น์? ๐ค
๋จผ์ , ์ด๋ฌํ ๋ถ์ผ์น๋ฅผ ์ดํดํ๋ ์ด์ ์ ๋ํด ์ด์ผ๊ธฐํด ๋ณด๊ฒ ์ต๋๋ค. ๋ง์ ์ปค๋ฎค๋ํฐ ๋ฉค๋ฒ๋ค์ ๐ค Transformers ๋ชจ๋ธ์ ๊ทธ๋๋ก ์ฌ์ฉํ๊ณ , ์ฐ๋ฆฌ์ ๋ชจ๋ธ์ด ์์๋๋ก ์๋ํ ๊ฒ์ด๋ผ๊ณ ๋ฏฟ์ต๋๋ค. ๋ ํ๋ ์์ํฌ ๊ฐ์ ํฐ ๋ถ์ผ์น๊ฐ ์์ผ๋ฉด ๋ชจ๋ธ์ด ์ ์ด๋ ํ๋์ ํ๋ ์์ํฌ์ ๋ํ ์ฐธ์กฐ ๊ตฌํ์ ๋ฐ๋ฅด์ง ์์์ ์๋ฏธํฉ๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ์๋ํ ๋๋ก ์๋ํ์ง ์์ ์ ์์์ ๋ํ๋
๋๋ค. ์ด๋ ์์ ์คํ๋์ง ์๋ ๋ชจ๋ธ๋ณด๋ค ๋์ ์ ์์ต๋๋ค! ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ๋ชจ๋ ๋ชจ๋ธ์ ํ๋ ์์ํฌ ๋ถ์ผ์น๋ฅผ 1e-5
๋ณด๋ค ์๊ฒ ์ ์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๊ธฐํ ์ซ์ ๋ฌธ์ ์ ๋ง์ฐฌ๊ฐ์ง๋ก, ์ธ์ธํ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ธ์ธํจ์ ์ง์คํ๋ ๊ณต์ ์์ ํ์ ์์๋ ์ธ๋ด์ฌ์ ๋๋ค. ์ด๋ฌํ ์ข ๋ฅ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ๋ ๊ถ์ฅ๋๋ ์์ ํ๋ฆ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๋ถ์ผ์น์ ์์ธ์ ์ฐพ์๋ณด์ญ์์ค. ๋ณํ ์ค์ธ ๋ชจ๋ธ์ ์๋ง๋ ํน์ ์ง์ ๊น์ง ๊ฑฐ์ ๋์ผํ ๋ด๋ถ ๋ณ์๋ฅผ ๊ฐ์ง๊ณ ์์ ๊ฒ์
๋๋ค. ๋ ํ๋ ์์ํฌ์ ์ํคํ
์ฒ์
breakpoint()
๋ฌธ์ ๋ฃ๊ณ , ์์์ ์๋๋ก ์ซ์ ๋ณ์์ ๊ฐ์ ๋น๊ตํ์ฌ ๋ฌธ์ ์ ๊ทผ์์ ์ฐพ์๋ ๋๋ค. - ์ด์ ๋ฌธ์ ์ ๊ทผ์์ ์ฐพ์์ผ๋ฏ๋ก ๐ค Transformers ํ์ ์ฐ๋ฝํ์ธ์. ์ฐ๋ฆฌ๋ ๋น์ทํ ๋ฌธ์ ๋ฅผ ์ด์ ์ ๊ฒช์์ ์ ์์ผ๋ฉฐ ๋น ๋ฅด๊ฒ ํด๊ฒฐ์ฑ ์ ์ ๊ณตํ ์ ์์ต๋๋ค. ์์ธ์ ์ธ ๊ฒฝ์ฐ์๋ StackOverflow์ GitHub ์ด์์ ๊ฐ์ ์ธ๊ธฐ์๋ ํ์ด์ง๋ฅผ ํ์ธํ์ญ์์ค.
- ๋ ์ด์ ํด๊ฒฐ์ฑ ์ด ์๋ ๊ฒฝ์ฐ, ๋ ๊น์ด ๋ค์ด๊ฐ์ผ ํฉ๋๋ค. ์ข์ ์์์ ๋ฌธ์ ์ ์์ธ์ ์ฐพ์์ผ๋ฏ๋ก ๋๋จธ์ง ๋ชจ๋ธ์ ์ถ์ํํ๊ณ ๋ฌธ์ ๊ฐ ์๋ ๋ช ๋ น์ด์ ์ด์ ์ ๋ง์ถ ์ ์์ต๋๋ค! ๋์ ์์์ ํด๋น ๋ช ๋ น์ด์ ์์ค ๊ตฌํ์ ๋ํด ์์๋ด์ผ ํ๋ค๋ ๊ฒ์ ๋๋ค. ์ผ๋ถ ๊ฒฝ์ฐ์๋ ์ฐธ์กฐ ๊ตฌํ์ ๋ฌธ์ ๊ฐ ์์ ์๋ ์์ผ๋ ์ ์คํธ๋ฆผ ์ ์ฅ์์์ ์ด์๋ฅผ ์ด๊ธฐ๋ฅผ ๊บผ๋ฆฌ์ง ๋ง์ญ์์ค.
์ด๋ค ๊ฒฝ์ฐ์๋ ๐ค Transformers ํ๊ณผ์ ํ ๋ก ์ ํตํด ๋ถ์ผ์น๋ฅผ ์์ ํ ์ ์์ ์๋ ์์ต๋๋ค. ๋ชจ๋ธ์ ์ถ๋ ฅ ๋ ์ด์ด์์ ๋ถ์ผ์น๊ฐ ๋งค์ฐ ์์ง๋ง ์จ๊ฒจ์ง ์ํ์์ ํฌ๊ฒ ๋ํ๋ ์ ์๊ธฐ ๋๋ฌธ์
๋๋ค. ์ด ๊ฒฝ์ฐ ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ ๊ฒ์ ์ฐ์ ์ํ๊ธฐ ์ํด ๋ถ์ผ์น๋ฅผ ๋ฌด์ํ๊ธฐ๋ก ๊ฒฐ์ ํ ์๋ ์์ต๋๋ค. ์์์ ์ธ๊ธํ pt-to-tf
CLI์๋ ๊ฐ์ค์น ๋ณํ ์ ์ค๋ฅ ๋ฉ์์ง๋ฅผ ๋ฌด์ํ๋ --max-error
ํ๋๊ทธ๊ฐ ์์ต๋๋ค.