Saxo commited on
Commit
4c51fb5
·
verified ·
1 Parent(s): 7ca606c

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -29,7 +29,7 @@ pipeline_tag: text-generation
29
 
30
  AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성 박사(Saxo)가 Mistral-Nemo-Instruct-2407 베이스모델을 KT-CLOUD상의 H100-80G 4개를 통해 SFT->DPO 파인 튜닝을 한
31
  한글 언어 모델로 한국어-중국어-영어-일본어 교차 학습 데이터와 로지컬 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 한글 논리 문제 역시 대응 가능하도록 훈련한 모델이며 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용.
32
- 특히 고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩등이 강화된 모델
33
  Deepspeed Stage=3, rslora, flash attention 2 를 사용
34
 
35
  Dr. Yunsung Ji (Saxo), a data scientist at Linkbricks, a company specializing in AI and big data analytics, fine-tuned the Mistral-Nemo-Instruct-2407 base model with SFT->DPO using four H100-80Gs on KT-CLOUD.
 
29
 
30
  AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성 박사(Saxo)가 Mistral-Nemo-Instruct-2407 베이스모델을 KT-CLOUD상의 H100-80G 4개를 통해 SFT->DPO 파인 튜닝을 한
31
  한글 언어 모델로 한국어-중국어-영어-일본어 교차 학습 데이터와 로지컬 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 한글 논리 문제 역시 대응 가능하도록 훈련한 모델이며 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용.
32
+ 특히 고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩등이 강화된 모델, Context Window Size=128K
33
  Deepspeed Stage=3, rslora, flash attention 2 를 사용
34
 
35
  Dr. Yunsung Ji (Saxo), a data scientist at Linkbricks, a company specializing in AI and big data analytics, fine-tuned the Mistral-Nemo-Instruct-2407 base model with SFT->DPO using four H100-80Gs on KT-CLOUD.