Norod78
/

TinyStories-3M-val-Hebrew

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Norod78 commited on Jun 28, 2023

Commit

2f2b7d2

•

1 Parent(s): a5f152a

Update README.md

Files changed (1) hide show

README.md +17 -17

README.md CHANGED Viewed

@@ -4,28 +4,32 @@ tags:
 model-index:
 - name: TinyStories-3M-val-Hebrew
   results: []
 ---
-<!-- This model card has been generated automatically according to the information the Trainer had access to. You
-should probably proofread and complete it, then remove this comment. -->
 # TinyStories-3M-val-Hebrew
-<!--This model is a fine-tuned version of [./TinyStories-3M-val-Hebrew](https://huggingface.co/./TinyStories-3M-val-Hebrew) on an unknown dataset.-->
-## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
-## Training procedure
 ### Training hyperparameters
@@ -39,13 +43,9 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 500
 - num_epochs: 300.0
-### Training results
 ### Framework versions
 - Transformers 4.31.0.dev0
 - Pytorch 2.0.0
 - Datasets 2.13.1
-- Tokenizers 0.13.3

 model-index:
 - name: TinyStories-3M-val-Hebrew
   results: []
+license: mit
+language:
+- he
+widget:
+  - text: היה פעם
+  - text: פעם אחת
+  - text: <|startoftext|>
+  - text: החתול שלך מאוד חמוד ו
+pipeline_tag: text-generation
 ---
 # TinyStories-3M-val-Hebrew
+This model is trained upon [Norod78/TinyStoriesV2-GPT4-valid_heb-lineByLine-EoT](https://huggingface.co/datasets/Norod78/TinyStoriesV2-GPT4-valid_heb-lineByLine-EoT)
+Dataset is a machine translation of [TinyStoriesV2-GPT4-valid.txt](https://huggingface.co/datasets/roneneldan/TinyStories/blob/main/TinyStoriesV2-GPT4-valid.txt) by [roneneldan](https://huggingface.co/roneneldan)
+Trasnlation was done using [this](https://huggingface.co/datasets/Norod78/TinyStoriesV2-GPT4-valid_heb-lineByLine-EoT/blob/main/translate_file_2.py) script
+Original [Dataset](https://huggingface.co/datasets/roneneldan/TinyStories) containing synthetically generated (by GPT-3.5 and GPT-4) short stories that only use a small vocabulary.
+## Model description
+A very very small model (8M params) tarined on a very small dataset
+A [sample inference script](https://huggingface.co/Norod78/TinyStories-3M-val-Hebrew/blob/main/TinyStories-3M-val-Hebrew-inference.py) is available
 ### Training hyperparameters
 - lr_scheduler_warmup_steps: 500
 - num_epochs: 300.0
 ### Framework versions
 - Transformers 4.31.0.dev0
 - Pytorch 2.0.0
 - Datasets 2.13.1
+- Tokenizers 0.13.3