Saxo commited on
Commit
4b0e432
·
verified ·
1 Parent(s): 516ecc1

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -2
README.md CHANGED
@@ -39,7 +39,7 @@ pipeline_tag: text-generation
39
  </div>
40
 
41
  AIとビッグデータ分析の専門企業であるLinkbricksのデータサイエンティストであるジ・ユンソン(Saxo)ディレクターが <br>
42
- Hermes-3-Llama-3.1-70Bベースモデルを使用し、H100-80G 8個を通じて約35%程度のパラメータを日本語CPT(Continued-Pretraining)->SFT->DPO->MERGEした日本語強化言語モデル。<br>
43
  6千万件の日本ニュース及びウィキコーパスを基準に、様々なタスク別の日本語・韓国語・中国語・英語クロス学習データと数学及び論理判断データを通じて、日中韓英言語クロス補強処理と複雑な論理問題にも対応できるように訓練したモデルです。
44
  -トークナイザーは、単語拡張なしでベースモデルのまま使用します。<br>
45
  -カスタマーレビューやソーシャル投稿の高次元分析及びコーディングとライティング、数学、論理判断などが強化されたモデル。<br>
@@ -52,7 +52,7 @@ Hermes-3-Llama-3.1-70Bベースモデルを使用し、H100-80G 8個を通じて
52
  <br><br>
53
 
54
  AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성(Saxo) 이사가 <br>
55
- Hermes-3-Llama-3.1-70B 베이스모델을 사용해서 H100-80G 8개를 통해 약 35%정도의 파라미터를 일본어 CPT(Continued-Pretraining)->SFT->DPO->MERGE 한 일본어 강화 언어 모델<br>
56
  6천만건의 일본 뉴스 및 위키 코퍼스를 기준으로 다양한 테스크별 일본어-한국어-중국어-영어 교차 학습 데이터와 수학 및 논리판단 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 논리 문제 역시 대응 가능하도록 훈련한 모델이다.<br>
57
  -토크나이저는 단어 확장 없이 베이스 모델 그대로 사용<br>
58
  -고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩과 작문, 수학, 논리판단 등이 강화된 모델<br>
 
39
  </div>
40
 
41
  AIとビッグデータ分析の専門企業であるLinkbricksのデータサイエンティストであるジ・ユンソン(Saxo)ディレクターが <br>
42
+ Saxo/Linkbricks-Horizon-AI-Japanese-Base-70Bベースモデルを使用し、H100-80G 8個を通じて約35%程度のパラメータを日本語CPT(Continued-Pretraining)->SFT->DPO->MERGEした日本語強化言語モデル。<br>
43
  6千万件の日本ニュース及びウィキコーパスを基準に、様々なタスク別の日本語・韓国語・中国語・英語クロス学習データと数学及び論理判断データを通じて、日中韓英言語クロス補強処理と複雑な論理問題にも対応できるように訓練したモデルです。
44
  -トークナイザーは、単語拡張なしでベースモデルのまま使用します。<br>
45
  -カスタマーレビューやソーシャル投稿の高次元分析及びコーディングとライティング、数学、論理判断などが強化されたモデル。<br>
 
52
  <br><br>
53
 
54
  AI 와 빅데이터 분석 전문 기업인 Linkbricks의 데이터사이언티스트인 지윤성(Saxo) 이사가 <br>
55
+ Saxo/Linkbricks-Horizon-AI-Japanese-Base-70B 베이스모델을 사용해서 H100-80G 8개를 통해 약 35%정도의 파라미터를 일본어 CPT(Continued-Pretraining)->SFT->DPO->MERGE 한 일본어 강화 언어 모델<br>
56
  6천만건의 일본 뉴스 및 위키 코퍼스를 기준으로 다양한 테스크별 일본어-한국어-중국어-영어 교차 학습 데이터와 수학 및 논리판단 데이터를 통하여 한중일영 언어 교차 증강 처리와 복잡한 논리 문제 역시 대응 가능하도록 훈련한 모델이다.<br>
57
  -토크나이저는 단어 확장 없이 베이스 모델 그대로 사용<br>
58
  -고객 리뷰나 소셜 포스팅 고차원 분석 및 코딩과 작문, 수학, 논리판단 등이 강화된 모델<br>