huseinzol05
commited on
Commit
•
993afdd
1
Parent(s):
e1397a6
Update README.md
Browse files
README.md
CHANGED
@@ -7,4 +7,88 @@ language:
|
|
7 |
|
8 |
README at https://github.com/mesolitica/malaya/tree/5.1/session/mistral#7b-32768-context-length
|
9 |
|
10 |
-
WandB, https://wandb.ai/mesolitica/fpf-mistral-7b-hf-32k?workspace=user-husein-mesolitica
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
|
8 |
README at https://github.com/mesolitica/malaya/tree/5.1/session/mistral#7b-32768-context-length
|
9 |
|
10 |
+
WandB, https://wandb.ai/mesolitica/fpf-mistral-7b-hf-32k?workspace=user-husein-mesolitica
|
11 |
+
|
12 |
+
```python
|
13 |
+
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
|
14 |
+
import torch
|
15 |
+
|
16 |
+
TORCH_DTYPE = 'bfloat16'
|
17 |
+
nf4_config = BitsAndBytesConfig(
|
18 |
+
load_in_4bit=True,
|
19 |
+
bnb_4bit_quant_type='nf4',
|
20 |
+
bnb_4bit_use_double_quant=True,
|
21 |
+
bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
|
22 |
+
)
|
23 |
+
|
24 |
+
tokenizer = AutoTokenizer.from_pretrained('mesolitica/mistral-7b-32768-fpf')
|
25 |
+
model = AutoModelForCausalLM.from_pretrained(
|
26 |
+
'mesolitica/mistral-7b-32768-fpf',
|
27 |
+
use_flash_attention_2 = True,
|
28 |
+
quantization_config = nf4_config
|
29 |
+
)
|
30 |
+
|
31 |
+
prompt = '<s>Soalan: KWSP tu apa?\nJawapan:'
|
32 |
+
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
|
33 |
+
generate_kwargs = dict(
|
34 |
+
inputs,
|
35 |
+
max_new_tokens=512,
|
36 |
+
top_p=0.95,
|
37 |
+
top_k=50,
|
38 |
+
temperature=0.9,
|
39 |
+
do_sample=True,
|
40 |
+
num_beams=1,
|
41 |
+
repetition_penalty=1.05,
|
42 |
+
)
|
43 |
+
r = model.generate(**generate_kwargs)
|
44 |
+
print(tokenizer.decode(r[0]))
|
45 |
+
```
|
46 |
+
|
47 |
+
```text
|
48 |
+
<s> Soalan: KWSP tu apa?
|
49 |
+
Jawapan: kwsp ialah kwsp iaitu kumpulan wang simpanan pekerja</s>
|
50 |
+
```
|
51 |
+
|
52 |
+
```python
|
53 |
+
prompt = '<s>Soalan: kenapa malaysia suka makan nasi lemak?\nJawapan:'
|
54 |
+
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
|
55 |
+
generate_kwargs = dict(
|
56 |
+
inputs,
|
57 |
+
max_new_tokens=512,
|
58 |
+
top_p=0.95,
|
59 |
+
top_k=50,
|
60 |
+
temperature=0.9,
|
61 |
+
do_sample=True,
|
62 |
+
num_beams=1,
|
63 |
+
repetition_penalty=1.05,
|
64 |
+
)
|
65 |
+
r = model.generate(**generate_kwargs)
|
66 |
+
print(tokenizer.decode(r[0]))
|
67 |
+
```
|
68 |
+
|
69 |
+
```text
|
70 |
+
<s> Soalan: kenapa malaysia suka makan nasi lemak?
|
71 |
+
Jawapan:Nasi Lemak merupakan antara sarapan pagi yang paling popular dalam kalangan rakyat Malaysia terutamanya orang Melayu. Ia mudah didapati di mana-mana sahaja seperti restoran mamak, gerai tepi jalan, gerai di pasar pagi, di stesen minyak, pasar malam, dan sebagainya. Sajian ini juga dikenali sebagai Nasi lemak antarabangsa kerana mendapat sambutan hangat daripada seluruh dunia. Selain itu, nasi lemak mempunyai bau yang sangat menyelerakan dan rasanya juga sangat unik. Tidak hairanlah mengapa ia digemari oleh ramai orang.Nasi lemak mempunyai santan, kerisik, dan serbuk kunyit yang ditumis dalam lemak kelapa dan dibungkus dalam daun pisang atau mangkuk plastik. Nasi lemak biasanya disajikan bersama ayam goreng, daging rendang, telur rebus, ikan bilis, timun, dan sambal yang dibuat daripada kacang tanah, udang atau petai. Variasi lain termasuk parutan kelapa muda, bilis goreng, udang goreng, dan sotong goreng. Di Malaysia, nasi lemak boleh didapati di gerai di jalanan, restoran tradisional, gerai di pasar pagi, dan di gerai tepi jalan di seluruh negara.</s>
|
72 |
+
```
|
73 |
+
|
74 |
+
```python
|
75 |
+
prompt = '<s>Soalan: macam mana nak install awscli dalam ubuntu\nJawapan:'
|
76 |
+
inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
|
77 |
+
generate_kwargs = dict(
|
78 |
+
inputs,
|
79 |
+
max_new_tokens=512,
|
80 |
+
top_p=0.95,
|
81 |
+
top_k=50,
|
82 |
+
temperature=0.9,
|
83 |
+
do_sample=True,
|
84 |
+
num_beams=1,
|
85 |
+
repetition_penalty=1.05,
|
86 |
+
)
|
87 |
+
r = model.generate(**generate_kwargs)
|
88 |
+
print(tokenizer.decode(r[0]))
|
89 |
+
```
|
90 |
+
|
91 |
+
```text
|
92 |
+
<s> Soalan: macam mana nak install awscli dalam ubuntu
|
93 |
+
Jawapan: Anda boleh memasang awscli dalam Ubuntu dengan menggunakan pengurus pakej apt-get. Caranya adalah seperti berikut: 1. Buka terminal dan kemas kini senarai pakej dengan menjalankan arahan berikut: ```sudo apt-get update``` 2. Pasang awscli dengan menjalankan arahan berikut: ```sudo apt-get install awscli``` Selepas menyelesaikan langkah-langkah di atas, anda akan mempunyai awscli dipasang dalam Ubuntu anda. Anda boleh menggunakannya untuk berinteraksi dengan AWS SDK dalam kod Python anda.</s>
|
94 |
+
```
|