BangorAI
/

ALMA-Cymraeg-13B-0.1-4.0bpw-exl2

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

rhysjones commited on Nov 27, 2023

Commit

e59171d

·

1 Parent(s): 89123c5

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ _This is a Welsh version of the [ALMA](https://github.com/fe1ixxu/ALMA) LLM-base
 Mae'r model LLM yn seiliedig ar Lama-2-13B, gyda hyfforddiant parhaus ar ddata Gymreig [OSCAR-2301](https://huggingface.co/datasets/oscar-corpus/OSCAR-2301) am 3 Epoch
 ac yna hyfforddiant cywrain pellach ar ddata Cofnod y Cynulliad a ddarparir gan [TechIaith](https://huggingface.co/datasets/techiaith/cofnodycynulliad_en-cy).
-Mae'r fersiwn yma wedi ei gywasgu i 4.0bpw er mwyn llwytho mewn 10GB o gof GPU wrth ddefnyddio [ExLlamaV2](https://github.com/turboderp/exllamav2).
 ### Fformat Sgwrs
@@ -62,7 +62,7 @@ class ModelClass:
 DEBUG = os.environ.get("DEBUG") and True or False
 # Cychwyn model a storfa
-def load_model(model_directory, max_seq_len=8192):
     """
     Yn llwytho model o gyfeiriadur ac yn dychwelyd y generadur a'r tocynnwr
     """

 Mae'r model LLM yn seiliedig ar Lama-2-13B, gyda hyfforddiant parhaus ar ddata Gymreig [OSCAR-2301](https://huggingface.co/datasets/oscar-corpus/OSCAR-2301) am 3 Epoch
 ac yna hyfforddiant cywrain pellach ar ddata Cofnod y Cynulliad a ddarparir gan [TechIaith](https://huggingface.co/datasets/techiaith/cofnodycynulliad_en-cy).
+Mae'r fersiwn yma wedi ei gywasgu i 4.0bpw er mwyn llwytho mewn cof GPU o 10GB gyda testyn hyd at 4096 tocyn gan ddefnyddio [ExLlamaV2](https://github.com/turboderp/exllamav2).
 ### Fformat Sgwrs
 DEBUG = os.environ.get("DEBUG") and True or False
 # Cychwyn model a storfa
+def load_model(model_directory, max_seq_len=4096):
     """
     Yn llwytho model o gyfeiriadur ac yn dychwelyd y generadur a'r tocynnwr
     """