lingchensanwen
/

llama2-chat-generation-best-balanced

Inference Endpoints

Model card Files Files and versions Community

lingchensanwen commited on Apr 17

Commit

1d59286

•

1 Parent(s): 4f9c29d

Update qlora.yml

Files changed (1) hide show

qlora.yml +4 -9

qlora.yml CHANGED Viewed

@@ -1,20 +1,19 @@
 base_model: meta-llama/Llama-2-7b-chat-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
-# hub_model_id: llama2-generation
 load_in_8bit: false
 load_in_4bit: true
 strict: false
 datasets:
-  - path: /home/yw23374/axolotl/examples/mistral/data/final_data/upsampled_train.json
     ds_type: json
     type: alpaca
     split: train
 test_datasets:
-  - path: /home/yw23374/axolotl/examples/mistral/data/final_data/val.json
     ds_type: json
     type: alpaca
     split: train
@@ -23,7 +22,7 @@ load_best_model_at_end: False
 early_stopping_patience:
 dataset_prepared_path:
 val_set_size: 0
-output_dir: ./qlora-out-llama2-balance-3nd
 adapter: qlora
 lora_model_dir:
@@ -54,7 +53,7 @@ wandb_log_model:
 gradient_accumulation_steps: 2
 micro_batch_size: 1
-num_epochs: 5 #3 before, 5 for balanced
 optimizer: adamw_bnb_8bit
 lr_scheduler: cosine
 learning_rate: 0.0001
@@ -93,7 +92,3 @@ special_tokens:
   bos_token: "<s>"
   eos_token: "</s>"
   unk_token: "<unk>"
-# tokens: # these are delimiters
-#   - "<|im_start|>"
-#   - "<|im_end|>"

 base_model: meta-llama/Llama-2-7b-chat-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
 load_in_8bit: false
 load_in_4bit: true
 strict: false
 datasets:
+  - path: ../upsampled_train.json
     ds_type: json
     type: alpaca
     split: train
 test_datasets:
+  - path: ../val.json
     ds_type: json
     type: alpaca
     split: train
 early_stopping_patience:
 dataset_prepared_path:
 val_set_size: 0
+output_dir: ./qlora-out-llama2-balance-1st
 adapter: qlora
 lora_model_dir:
 gradient_accumulation_steps: 2
 micro_batch_size: 1
+num_epochs: 5
 optimizer: adamw_bnb_8bit
 lr_scheduler: cosine
 learning_rate: 0.0001
   bos_token: "<s>"
   eos_token: "</s>"
   unk_token: "<unk>"