Saxo
/

Linkbricks-Horizon-AI-Korean-Mistral-Nemo-sft-dpo-12B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Saxo commited on Aug 7, 2024

Commit

4c51fb5

·

verified ·

1 Parent(s): 7ca606c

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -29,7 +29,7 @@ pipeline_tag: text-generation
 AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성 박사(Saxo)가 Mistral-Nemo-Instruct-2407 베이스모델을 KT-CLOUD상의 H100-80G 4개를 통해 SFT->DPO 파인 튜닝을 한
 한글 언어 모델로 한국어-중국어-영어-일본어 교차 학습 데이터와 로지컬 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 한글 논리 문제 역시 대응 가능하도록 훈련한 모델이며 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용.
-특히 고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩등이 강화된 모델
 Deepspeed Stage=3, rslora, flash attention 2 를 사용
 Dr. Yunsung Ji (Saxo), a data scientist at Linkbricks, a company specializing in AI and big data analytics, fine-tuned the Mistral-Nemo-Instruct-2407 base model with SFT->DPO using four H100-80Gs on KT-CLOUD.

 AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성 박사(Saxo)가 Mistral-Nemo-Instruct-2407 베이스모델을 KT-CLOUD상의 H100-80G 4개를 통해 SFT->DPO 파인 튜닝을 한
 한글 언어 모델로 한국어-중국어-영어-일본어 교차 학습 데이터와 로지컬 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 한글 논리 문제 역시 대응 가능하도록 훈련한 모델이며 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용.
+특히 고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩등이 강화된 모델, Context Window Size=128K
 Deepspeed Stage=3, rslora, flash attention 2 를 사용
 Dr. Yunsung Ji (Saxo), a data scientist at Linkbricks, a company specializing in AI and big data analytics, fine-tuned the Mistral-Nemo-Instruct-2407 base model with SFT->DPO using four H100-80Gs on KT-CLOUD.