RuterNorway commited on
Commit
9e60276
1 Parent(s): 7147f42

Added dataset RuterNorway/OpenOrcaNo-15k

Browse files
Files changed (1) hide show
  1. README.md +5 -4
README.md CHANGED
@@ -12,6 +12,7 @@ tags:
12
  - norsk
13
  datasets:
14
  - NbAiLab/norwegian-alpaca
 
15
  ---
16
 
17
  # Llama 2 13b Chat Norwegian LoRA adaptor
@@ -21,7 +22,7 @@ Go [here](#demo-script) for a demo inference script and Google Colab implementat
21
 
22
  Llama-2-13b-chat-norwegian is a variant of [Meta](https://huggingface.co/meta-llama)´s [Llama 2 13b Chat](https://huggingface.co/meta-llama/Llama-2-13b-chat-hf) model, finetuned on a mix of norwegian datasets created in [Ruter AI Lab](https://ruter.no) the summer of 2023.
23
 
24
- The model is tuned to understand and generate text in Norwegian. It's trained for one epoch on norwegian-alpaca + 15000 samples of machine-translated data from OpenOrca (the dataset to be released). A small subset of custom-made instructional data is also included.
25
 
26
  For other versions of this model see:
27
  * [Llama-2-13b-chat-norwegian](https://huggingface.co/RuterNorway/Llama-2-13b-chat-norwegian)
@@ -31,7 +32,7 @@ For other versions of this model see:
31
 
32
  ## Data
33
  * Norwegian alpaca
34
- * 15k Norwegian OpenOrcra (to be released)
35
  * Small subset of custom made instructional data
36
 
37
  ## Intended Use
@@ -94,7 +95,7 @@ ___
94
  **Dette er LoRA-adapteren for Llama 2 13b Chat Norwegian modellen, og krever den orginale basismodellen for å kjøre**
95
  Llama-2-13b-chat-norwegian er en versjon av [Meta](https://huggingface.co/meta-llama) sin [Llama 2 13b Chat](https://huggingface.co/meta-llama/Llama-2-13b-chat-hf) model, finetuned på en kombinasjon av diverse norske datasett. Modellen ble laget i [Ruter AI Lab](https://ruter.no) 2023.
96
 
97
- Modellen er finetuned til å forstå og generere tekst på Norsk. Den er trent i én epoch med norwegian-alpaca + et utvalg av 15000 maskinoversatt data fra OpenOrca (datasett venter på utgivelse). Det består og av et lite sett med selvlagde instruksjonsdata.
98
 
99
  Andre versjoner av modellen:
100
 
@@ -105,7 +106,7 @@ Andre versjoner av modellen:
105
 
106
  ## Data
107
  * Norwegian alpaca
108
- * 15k Norwegian OpenOrcra (venter på utgivelse)
109
  * Lite sett med selvlagde instruksjonsdata
110
 
111
 
 
12
  - norsk
13
  datasets:
14
  - NbAiLab/norwegian-alpaca
15
+ - RuterNorway/OpenOrcaNo-15k
16
  ---
17
 
18
  # Llama 2 13b Chat Norwegian LoRA adaptor
 
22
 
23
  Llama-2-13b-chat-norwegian is a variant of [Meta](https://huggingface.co/meta-llama)´s [Llama 2 13b Chat](https://huggingface.co/meta-llama/Llama-2-13b-chat-hf) model, finetuned on a mix of norwegian datasets created in [Ruter AI Lab](https://ruter.no) the summer of 2023.
24
 
25
+ The model is tuned to understand and generate text in Norwegian. It's trained for one epoch on norwegian-alpaca + 15000 samples of machine-translated data from OpenOrca. A small subset of custom-made instructional data is also included.
26
 
27
  For other versions of this model see:
28
  * [Llama-2-13b-chat-norwegian](https://huggingface.co/RuterNorway/Llama-2-13b-chat-norwegian)
 
32
 
33
  ## Data
34
  * Norwegian alpaca
35
+ * 15k Norwegian OpenOrcra
36
  * Small subset of custom made instructional data
37
 
38
  ## Intended Use
 
95
  **Dette er LoRA-adapteren for Llama 2 13b Chat Norwegian modellen, og krever den orginale basismodellen for å kjøre**
96
  Llama-2-13b-chat-norwegian er en versjon av [Meta](https://huggingface.co/meta-llama) sin [Llama 2 13b Chat](https://huggingface.co/meta-llama/Llama-2-13b-chat-hf) model, finetuned på en kombinasjon av diverse norske datasett. Modellen ble laget i [Ruter AI Lab](https://ruter.no) 2023.
97
 
98
+ Modellen er finetuned til å forstå og generere tekst på Norsk. Den er trent i én epoch med norwegian-alpaca + et utvalg av 15000 maskinoversatt data fra OpenOrca. Det består og av et lite sett med selvlagde instruksjonsdata.
99
 
100
  Andre versjoner av modellen:
101
 
 
106
 
107
  ## Data
108
  * Norwegian alpaca
109
+ * 15k Norwegian OpenOrcra
110
  * Lite sett med selvlagde instruksjonsdata
111
 
112