hexinran09
/

xr_dat_test_part2

Text Generation

text-generation-inference

Model card Files Files and versions Community

hexinran09 commited on Apr 22, 2024

Commit

00c11f8

·

verified ·

1 Parent(s): fd9b8bc

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -1,3 +1,6 @@
 闭源大模型和开源大模型
 大型语言模型，如GPT-3.5、GPT-4、Gemini以及Claude等，被视为人工智能（AI）领域的突破性技术，它们通过其庞大的规模和复杂性，开启了生成类人文本和提供复杂问题解决能力的新领域。这些模型的核心价值在于它们的“涌现能力”（emergent abilities），即超出明确训练目标的能力，使得它们能够以惊人的熟练度处理多样化的任务。
 闭源大模型的shortcomings：尽管如GPT-4和Gemini这样的专有LLMs具有显著的能力，但它们的可访问性有限且成本较高，这对个人和小型组织来说是一个重大障碍。
@@ -6,4 +9,4 @@
 为了弥合专有和开源LLMs之间的性能差距，知识蒸馏技术日益成为一种关键手段。它涉及利用如GPT-4或Gemini这样的先进模型作为指导框架，以增强开源LLMs的能力。此过程类似于将一位高度熟练的教师的“知识”传递给学生，其中学生（例如开源LLM）学习模仿教师（例如专有LLM）的性能特征。除了传统的知识蒸馏算法外，数据增强（Data Augmentation, DA）已成为实现LLMs知识蒸馏的流行范式之一。
 ---
 license: apache-2.0
----

+---
+license: apache-2.0
+---
 闭源大模型和开源大模型
 大型语言模型，如GPT-3.5、GPT-4、Gemini以及Claude等，被视为人工智能（AI）领域的突破性技术，它们通过其庞大的规模和复杂性，开启了生成类人文本和提供复杂问题解决能力的新领域。这些模型的核心价值在于它们的“涌现能力”（emergent abilities），即超出明确训练目标的能力，使得它们能够以惊人的熟练度处理多样化的任务。
 闭源大模型的shortcomings：尽管如GPT-4和Gemini这样的专有LLMs具有显著的能力，但它们的可访问性有限且成本较高，这对个人和小型组织来说是一个重大障碍。
 为了弥合专有和开源LLMs之间的性能差距，知识蒸馏技术日益成为一种关键手段。它涉及利用如GPT-4或Gemini这样的先进模型作为指导框架，以增强开源LLMs的能力。此过程类似于将一位高度熟练的教师的“知识”传递给学生，其中学生（例如开源LLM）学习模仿教师（例如专有LLM）的性能特征。除了传统的知识蒸馏算法外，数据增强（Data Augmentation, DA）已成为实现LLMs知识蒸馏的流行范式之一。
 ---
 license: apache-2.0
+---