Update README.md
Browse files
README.md
CHANGED
@@ -1,3 +1,6 @@
|
|
|
|
|
|
|
|
1 |
闭源大模型和开源大模型
|
2 |
大型语言模型,如GPT-3.5、GPT-4、Gemini以及Claude等,被视为人工智能(AI)领域的突破性技术,它们通过其庞大的规模和复杂性,开启了生成类人文本和提供复杂问题解决能力的新领域。这些模型的核心价值在于它们的“涌现能力”(emergent abilities),即超出明确训练目标的能力,使得它们能够以惊人的熟练度处理多样化的任务。
|
3 |
闭源大模型的shortcomings:尽管如GPT-4和Gemini这样的专有LLMs具有显著的能力,但它们的可访问性有限且成本较高,这对个人和小型组织来说是一个重大障碍。
|
@@ -6,4 +9,4 @@
|
|
6 |
为了弥合专有和开源LLMs之间的性能差距,知识蒸馏技术日益成为一种关键手段。它涉及利用如GPT-4或Gemini这样的先进模型作为指导框架,以增强开源LLMs的能力。此过程类似于将一位高度熟练的教师的“知识”传递给学生,其中学生(例如开源LLM)学习模仿教师(例如专有LLM)的性能特征。除了传统的知识蒸馏算法外,数据增强(Data Augmentation, DA)已成为实现LLMs知识蒸馏的流行范式之一。
|
7 |
---
|
8 |
license: apache-2.0
|
9 |
-
---
|
|
|
1 |
+
---
|
2 |
+
license: apache-2.0
|
3 |
+
---
|
4 |
闭源大模型和开源大模型
|
5 |
大型语言模型,如GPT-3.5、GPT-4、Gemini以及Claude等,被视为人工智能(AI)领域的突破性技术,它们通过其庞大的规模和复杂性,开启了生成类人文本和提供复杂问题解决能力的新领域。这些模型的核心价值在于它们的“涌现能力”(emergent abilities),即超出明确训练目标的能力,使得它们能够以惊人的熟练度处理多样化的任务。
|
6 |
闭源大模型的shortcomings:尽管如GPT-4和Gemini这样的专有LLMs具有显著的能力,但它们的可访问性有限且成本较高,这对个人和小型组织来说是一个重大障碍。
|
|
|
9 |
为了弥合专有和开源LLMs之间的性能差距,知识蒸馏技术日益成为一种关键手段。它涉及利用如GPT-4或Gemini这样的先进模型作为指导框架,以增强开源LLMs的能力。此过程类似于将一位高度熟练的教师的“知识”传递给学生,其中学生(例如开源LLM)学习模仿教师(例如专有LLM)的性能特征。除了传统的知识蒸馏算法外,数据增强(Data Augmentation, DA)已成为实现LLMs知识蒸馏的流行范式之一。
|
10 |
---
|
11 |
license: apache-2.0
|
12 |
+
---
|