DachengZhang commited on
Commit
9fdce6f
1 Parent(s): a5caed9

Update README_cn.md

Browse files
Files changed (1) hide show
  1. README_cn.md +3 -1
README_cn.md CHANGED
@@ -45,7 +45,9 @@ pipeline_tag: text-generation
45
 
46
  # 模型介绍
47
 
48
- - Orion-14B-Base是一个具有140亿参数的多语种大模型,该模型在一个包含2.5万亿token的多样化数据集上进行了训练,涵盖了中文、英语、日语、韩语等多种语言。在多语言环境下的一系列任务中展现出卓越的性能。在主流的公开基准评测中,Orion-14B系列模型表现优异,多项指标显著超越同等参数基本的其他模型。
 
 
49
 
50
  - Orion-14B系列大模型有以下几个特点:
51
  - 基座20B参数级别大模型综合评测效果表现优异
 
45
 
46
  # 模型介绍
47
 
48
+ - Orion-14B-Chat 是基于Orion-14B-Base 使用85W左右的高质量语料库微调而来(仅sft),同样支持中英日韩。在MT-Bench、AlignBench评测集上表现优异,多项指标显著超越同等参数基本的其他模型。
49
+
50
+ - 85W微调语料包含两部分:22W左右的人工精标数据集和63W从开源数据里经过模型筛选、语义去重整理而来。其中日韩数据共7W,仅做了简单清洗和去重。
51
 
52
  - Orion-14B系列大模型有以下几个特点:
53
  - 基座20B参数级别大模型综合评测效果表现优异