rhysjones's picture
Create README.md
7005b68 verified
|
raw
history blame contribute delete
No virus
470 Bytes
metadata
license: apache-2.0
datasets:
  - oscar-corpus/OSCAR-2301
language:
  - cy

Mae'r model LLM yn seiliedig ar Mistral-7B, gyda estyniad yn y tocynnydd ar gyfer y Gymraeg drwy fod yn seiliedig ar BangorAI/mistral-7b-cy-tokenizer

Mae wedi cael hyfforddiant parhaus ar ddata Gymreig OSCAR-2301 am 1 Epoch.

Pwrpas y model yw fod yn gychwyn i hyfforddiant cywrain pellach i greu casgliad o LLMs cymreig penodol.