tiendung commited on
Commit
a1f7e9d
1 Parent(s): e5e62d5

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -1
README.md CHANGED
@@ -23,4 +23,10 @@ Có thể mở rộng bộ vocab có sẵn với 2-pass vocab exention, và thê
23
  Chúng tôi là những người đầu tiên crawl toàn bộ common crawl để lọc dữ liệu tiếng Việt tại https://huggingface.co/datasets/Symato/cc (shout out to
24
  [binhvq](https://huggingface.co/binhvq), [nampdn-ai](https://huggingface.co/nampdn-ai) và [iambestfeed](https://huggingface.co/iambestfeed))
25
 
26
- Bạn có thể tìm thấy các datasets khác tại [Vietnamese Text Corpus Collection](https://huggingface.co/collections/Symato/vietnamese-text-corpus-66f612f604f2d5ae977dba70)
 
 
 
 
 
 
 
23
  Chúng tôi là những người đầu tiên crawl toàn bộ common crawl để lọc dữ liệu tiếng Việt tại https://huggingface.co/datasets/Symato/cc (shout out to
24
  [binhvq](https://huggingface.co/binhvq), [nampdn-ai](https://huggingface.co/nampdn-ai) và [iambestfeed](https://huggingface.co/iambestfeed))
25
 
26
+ Bạn có thể tìm thấy các datasets khác tại [Vietnamese Text Corpus Collection](https://huggingface.co/collections/Symato/vietnamese-text-corpus-66f612f604f2d5ae977dba70)
27
+
28
+ Và bộ dữ liệu có độ chắt lọc cao hơn tại [Knowledge Base Collection](https://huggingface.co/collections/Symato/knowledge-base-66f614977024ed3df9531db9)
29
+
30
+ ## DOT series
31
+ DOT: do one thing (and do it well) là tuyển tập các bộ dữ liệu và mô hình chúng tôi phát triển trong quá trình làm các ứng dụng liên quan tới LLM và AI tại Việt Nam.
32
+ Ngoài LLM để giải quyết các vấn đề chính, có rất nhiều bài toán nhỏ có thể giải quyết nhanh gọn bằng SML (LM nhỏ hơn) một cách hiệu quả. Chúng tôi sẽ giới thiệu với các bạn trong [DOT Collection](https://huggingface.co/collections/Symato/knowledge-base-66f614977024ed3df9531db9)