license: apache-2.0 | |
datasets: | |
- allenai/MADLAD-400 | |
Mae'r model LLM yn seiliedig ar [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1), gyda hyfforddiant parhaus am 3 Epoch cyfan o ddata Cymreig o'r dataset [allenai/MADLAD-400](https://huggingface.co/datasets/allenai/MADLAD-400). | |
Pwrpas y model yw fod yn gychwyn i hyfforddiant cywrain pellach i greu casgliad o LLMs Cymreig penodol. | |
Mae'r fersiwn 2 epoch gyda training evals ychydig yn is na'r fersiwn yma. Mae'n syniad arbrofi gyda'r ddau fersiwn. | |
--- | |
*Contains information from [allenai/MADLAD-400](https://huggingface.co/datasets/allenai/MADLAD-400) which is made available | |
under the ODC Attribution License.* | |