TinyLlama
/

TinyLlama-1.1B-step-50K-105b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

PY007 commited on Sep 4, 2023

Commit

1206dc3

·

1 Parent(s): d812e22

Update README.md

Files changed (1) hide show

README.md +9 -2

README.md CHANGED Viewed

@@ -1,3 +1,11 @@
 <div align="center">
 # TinyLlama-1.1B
@@ -55,5 +63,4 @@ Below are some details of our training setup:
 | Combined Dataset Size           | 1 trillion tokens                                              |
 | Total Tokens During Training    | 3 trillion (3 epochs/1430k steps)                                          |
 | Natural Language to Code Ratio  | 7:3                                                            |
-| Hardware                        | 16 A100-40G GPUs                                               |

+---
+license: apache-2.0
+datasets:
+- cerebras/SlimPajama-627B
+- bigcode/starcoderdata
+language:
+- en
+---
 <div align="center">
 # TinyLlama-1.1B
 | Combined Dataset Size           | 1 trillion tokens                                              |
 | Total Tokens During Training    | 3 trillion (3 epochs/1430k steps)                                          |
 | Natural Language to Code Ratio  | 7:3                                                            |
+| Hardware                        | 16 A100-40G GPUs                                               |