BM-K commited on
Commit
511a137
β€’
1 Parent(s): c87b4a8

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -35
README.md CHANGED
@@ -12,6 +12,9 @@ license_link: https://huggingface.co/LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct/blob/m
12
  ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” μ΄λŸ¬ν•œ μ§€μ‹μ΄λ‚˜ 기술이 μ‚¬λžŒμ˜ μ„ ν˜Έμ™€ 쑰화될 수 μžˆλ„λ‘ [Direct Preference Optimization](https://arxiv.org/abs/2305.18290)κ³Ό 같은 기법을 톡해 ν•™μŠ΅ν•  κ³„νšμž…λ‹ˆλ‹€.<br><br>
13
  ν˜„μž¬ μ—…λ‘œλ“œλœ μ†ŒμŠ€ μ½”λ“œμ˜ 경우 인간 μ„ ν˜Έ λ°μ΄ν„°μ…‹λ§Œ ꡬ좕 λœλ‹€λ©΄ μœ„ 기법을 μ μš©ν•  수 μžˆλ„λ‘ μž‘μ„±λ˜μ—ˆμœΌλ©°, μΆ”ν›„ μžλ™μœΌλ‘œ μ μš©λ˜μ–΄ ν•™μŠ΅λ  수 μžˆλ„λ‘ 고도화 μ˜ˆμ •μž…λ‹ˆλ‹€.
14
 
 
 
 
15
  ## Quick Start
16
  ```python
17
  import torch
@@ -57,41 +60,6 @@ summary = tokenizer.decode(outputs[0][source.shape[-1]:], skip_special_tokens=Tr
57
  """
58
  ```
59
 
60
- ## ν•™μŠ΅ 및 평가 방법
61
-
62
- ### μ€€λΉ„
63
-
64
- ```
65
- # ν•„μš” 라이브러리λ₯Ό μ„€μΉ˜ν•©λ‹ˆλ‹€.
66
- pip install -r requirements.txt
67
- ```
68
-
69
- ```
70
- # ν•™μŠ΅ 및 평가 데이터셋을 μœ„μΉ˜μ‹œν‚΅λ‹ˆλ‹€.
71
- dcs_2024_data
72
- β”œβ”€β”€ μΌμƒλŒ€ν™”μš”μ•½_train.json
73
- β”œβ”€β”€ μΌμƒλŒ€ν™”μš”μ•½_dev.json
74
- └── μΌμƒλŒ€ν™”μš”μ•½_train.json
75
- ```
76
-
77
- huggingfaceμ—μ„œ [EXAONE](https://huggingface.co/LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct) access token을 [λ°œκΈ‰](https://huggingface.co/docs/hub/security-tokens)λ°›μŠ΅λ‹ˆλ‹€.
78
-
79
- ### ν•™μŠ΅
80
-
81
- ```
82
- CUDA_VISIBLE_DEVICES=0,1,2 python -m train model=exaone datasets=[DCS] loss=sft exp_name=exaone_sft batch_size=4 max_prompt_length=2048 max_length=2560 token='{access_token}'
83
- ```
84
-
85
- ν•™μŠ΅μ΄ μ™„λ£Œλ˜λ©΄ `model_ckpt/root/` λ””λ ‰ν† λ¦¬μ•ˆμ— `exp_name + {ν•™μŠ΅ μ‹œμž‘ μ‹œκ°„}`에 ν•΄λ‹Ήν•˜λŠ” λͺ¨λΈ 체크포인트 파일이 μ €μž₯λ©λ‹ˆλ‹€.
86
-
87
- ### μΆ”λ‘ 
88
-
89
- ```
90
- python inference/run_test.py --output result.json --model_id model_ckpt/root/exaone_sft_2024-08-26_16-28-10_430889/step-992/ --device cuda:0
91
- ```
92
-
93
- `model_id` λ³€μˆ˜μ— λͺ¨λΈ 체크포인트 경둜λ₯Ό μž…λ ₯ν•œ λ’€ μ‹€ν–‰ν•˜λ©΄ μ†ŒμŠ€μ½”λ“œ 폴더에 `output` 파일이 μƒμ„±λ˜κ³ , ν•΄λ‹Ή 파일 제좜 μ‹œ μˆœμœ„ν‘œ(λ¦¬λ”λ³΄λ“œ)에 성적이 λ°˜μ˜λ©λ‹ˆλ‹€.
94
-
95
  ## Citing
96
  ```
97
  @inproceedings{exaone_sft_dcs,
 
12
  ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” μ΄λŸ¬ν•œ μ§€μ‹μ΄λ‚˜ 기술이 μ‚¬λžŒμ˜ μ„ ν˜Έμ™€ 쑰화될 수 μžˆλ„λ‘ [Direct Preference Optimization](https://arxiv.org/abs/2305.18290)κ³Ό 같은 기법을 톡해 ν•™μŠ΅ν•  κ³„νšμž…λ‹ˆλ‹€.<br><br>
13
  ν˜„μž¬ μ—…λ‘œλ“œλœ μ†ŒμŠ€ μ½”λ“œμ˜ 경우 인간 μ„ ν˜Έ λ°μ΄ν„°μ…‹λ§Œ ꡬ좕 λœλ‹€λ©΄ μœ„ 기법을 μ μš©ν•  수 μžˆλ„λ‘ μž‘μ„±λ˜μ—ˆμœΌλ©°, μΆ”ν›„ μžλ™μœΌλ‘œ μ μš©λ˜μ–΄ ν•™μŠ΅λ  수 μžˆλ„λ‘ 고도화 μ˜ˆμ •μž…λ‹ˆλ‹€.
14
 
15
+ ## ν•™μŠ΅ 및 평가 방법
16
+ https://github.com/BM-K/2024-NIKL-DCS
17
+
18
  ## Quick Start
19
  ```python
20
  import torch
 
60
  """
61
  ```
62
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
63
  ## Citing
64
  ```
65
  @inproceedings{exaone_sft_dcs,