File size: 470 Bytes
7005b68
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
---
license: apache-2.0
datasets:
- oscar-corpus/OSCAR-2301
language:
- cy
---

Mae'r model LLM yn seiliedig ar Mistral-7B, gyda estyniad yn y tocynnydd ar gyfer y Gymraeg drwy fod yn seiliedig ar [BangorAI/mistral-7b-cy-tokenizer](https://huggingface.co/BangorAI/mistral-7b-cy-tokenizer)

Mae wedi cael hyfforddiant parhaus ar ddata Gymreig OSCAR-2301 am 1 Epoch.

Pwrpas y model yw fod yn gychwyn i hyfforddiant cywrain pellach i greu casgliad o LLMs cymreig penodol.