Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

winglian commited on May 15, 2024

Commit

4fde300

unverified ·

1 Parent(s): 3319780

update outputs path so that we can mount workspace to /workspace/data (#1623)

Browse files

* update outputs path so that we can mount workspace to /workspace/data

* fix ln order

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

docker/Dockerfile-cloud +3 -1
examples/cerebras/btlm-ft.yml +1 -1
examples/cerebras/qlora.yml +1 -1
examples/code-llama/13b/lora.yml +1 -1
examples/code-llama/13b/qlora.yml +1 -1
examples/code-llama/34b/lora.yml +1 -1
examples/code-llama/34b/qlora.yml +1 -1
examples/code-llama/7b/lora.yml +1 -1
examples/code-llama/7b/qlora.yml +1 -1
examples/colab-notebooks/colab-axolotl-example.ipynb +1 -1
examples/dbrx/16bit-lora.yaml +1 -1
examples/dbrx/8bit-lora.yaml +1 -1
examples/dbrx/fft-ds-zero3.yaml +1 -1
examples/falcon/config-7b-lora.yml +1 -1
examples/falcon/config-7b-qlora.yml +1 -1
examples/falcon/config-7b.yml +1 -1
examples/gemma/qlora.yml +1 -1
examples/gptj/qlora.yml +1 -1
examples/jamba/qlora.yaml +1 -1
examples/jamba/qlora_deepspeed.yaml +1 -1
examples/jeopardy-bot/config.yml +1 -1
examples/llama-2/fft_optimized.yml +1 -1
examples/llama-2/gptq-lora.yml +1 -1
examples/llama-2/lisa.yml +1 -1
examples/llama-2/loftq.yml +1 -1
examples/llama-2/lora.yml +1 -1
examples/llama-2/qlora-fsdp.yml +1 -1
examples/llama-2/qlora.yml +1 -1
examples/llama-2/relora.yml +1 -1
examples/llama-3/fft-8b.yaml +1 -1
examples/llama-3/lora-8b.yml +1 -1
examples/llama-3/qlora-fsdp-70b.yaml +1 -1
examples/llama-3/qlora.yml +1 -1
examples/mamba/config.yml +1 -1
examples/mistral/bigstral-ds-zero3.yaml +1 -1
examples/mistral/config.yml +1 -1
examples/mistral/lora-mps.yml +1 -1
examples/mistral/lora.yml +1 -1
examples/mistral/mistral-qlora-fsdp.yml +1 -1
examples/mistral/mistral-qlora-orpo.yml +1 -1
examples/mistral/mixtral-8x22b-qlora-fsdp.yml +1 -1
examples/mistral/mixtral-qlora-fsdp.yml +1 -1
examples/mistral/mixtral.yml +1 -1
examples/mistral/mixtral_22.yml +1 -1
examples/mistral/qlora.yml +1 -1
examples/mpt-7b/config.yml +1 -1
examples/openllama-3b/config.yml +1 -1
examples/openllama-3b/lora.yml +1 -1
examples/openllama-3b/qlora.yml +1 -1
examples/phi/phi-ft.yml +1 -1

docker/Dockerfile-cloud CHANGED Viewed

@@ -21,7 +21,9 @@ RUN apt install --yes --no-install-recommends openssh-server tmux && \
     printf "\n[[ -z \"\$TMUX\"  ]] && { tmux attach-session -t ssh_tmux || tmux new-session -s ssh_tmux; exit; }\n" >> ~/.bashrc && \
     printf "[ ! -z \"\$TERM\" -a -r /etc/motd ] && cat /etc/motd\n" >> ~/.bashrc && \
     chmod +x /workspace/axolotl/scripts/cloud-entrypoint.sh && \
-    chmod +x /root/cloud-entrypoint.sh
 ENTRYPOINT ["/root/cloud-entrypoint.sh"]
 CMD ["sleep", "infinity"]

     printf "\n[[ -z \"\$TMUX\"  ]] && { tmux attach-session -t ssh_tmux || tmux new-session -s ssh_tmux; exit; }\n" >> ~/.bashrc && \
     printf "[ ! -z \"\$TERM\" -a -r /etc/motd ] && cat /etc/motd\n" >> ~/.bashrc && \
     chmod +x /workspace/axolotl/scripts/cloud-entrypoint.sh && \
+    chmod +x /root/cloud-entrypoint.sh && \
+    mkdir -p /workspace/data/axolotl-artifacts && \
+    ln -sf /workspace/data/axolotl-artifacts /workspace/axolotl/outputs
 ENTRYPOINT ["/root/cloud-entrypoint.sh"]
 CMD ["sleep", "infinity"]

examples/cerebras/btlm-ft.yml CHANGED Viewed

@@ -38,7 +38,7 @@ wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: btlm-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 1

 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/btlm-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 1

examples/cerebras/qlora.yml CHANGED Viewed

@@ -25,7 +25,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./qlora-out
 batch_size: 4
 micro_batch_size: 4
 num_epochs: 2

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/qlora-out
 batch_size: 4
 micro_batch_size: 4
 num_epochs: 2

examples/code-llama/13b/lora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/code-llama/13b/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/code-llama/34b/lora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/code-llama/34b/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/code-llama/7b/lora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/code-llama/7b/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/colab-notebooks/colab-axolotl-example.ipynb CHANGED Viewed

@@ -84,7 +84,7 @@
         "    type: alpaca\n",
         "dataset_prepared_path:\n",
         "val_set_size: 0.05\n",
-        "output_dir: ./qlora-out\n",
         "\n",
         "adapter: qlora\n",
         "lora_model_dir:\n",

         "    type: alpaca\n",
         "dataset_prepared_path:\n",
         "val_set_size: 0.05\n",
+        "output_dir: ./outputs/qlora-out\n",
         "\n",
         "adapter: qlora\n",
         "lora_model_dir:\n",

examples/dbrx/16bit-lora.yaml CHANGED Viewed

@@ -10,7 +10,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 512
 sample_packing: false

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 512
 sample_packing: false

examples/dbrx/8bit-lora.yaml CHANGED Viewed

@@ -10,7 +10,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 512
 sample_packing: false

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 512
 sample_packing: false

examples/dbrx/fft-ds-zero3.yaml CHANGED Viewed

@@ -10,7 +10,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 512
 sample_packing: false

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 512
 sample_packing: false

examples/falcon/config-7b-lora.yml CHANGED Viewed

@@ -28,7 +28,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./falcon-7b
 batch_size: 2
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/falcon-7b
 batch_size: 2
 micro_batch_size: 1
 num_epochs: 4

examples/falcon/config-7b-qlora.yml CHANGED Viewed

@@ -42,7 +42,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./qlora-out
 # QLoRA paper Table 9
 # - 16 for 7b & 13b

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/qlora-out
 # QLoRA paper Table 9
 # - 16 for 7b & 13b

examples/falcon/config-7b.yml CHANGED Viewed

@@ -28,7 +28,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./falcon-7b
 batch_size: 2
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/falcon-7b
 batch_size: 2
 micro_batch_size: 1
 num_epochs: 4

examples/gemma/qlora.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
   - path: mhenrichsen/alpaca_2k_test
     type: alpaca
 val_set_size: 0.1
-output_dir: ./out
 adapter: qlora
 lora_r: 32

   - path: mhenrichsen/alpaca_2k_test
     type: alpaca
 val_set_size: 0.1
+output_dir: ./outputs/out
 adapter: qlora
 lora_r: 32

examples/gptj/qlora.yml CHANGED Viewed

@@ -23,7 +23,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./qlora-out
 gradient_accumulation_steps: 2
 micro_batch_size: 2
 num_epochs: 2

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/qlora-out
 gradient_accumulation_steps: 2
 micro_batch_size: 2
 num_epochs: 2

examples/jamba/qlora.yaml CHANGED Viewed

@@ -10,7 +10,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 4096
 sample_packing: false

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 4096
 sample_packing: false

examples/jamba/qlora_deepspeed.yaml CHANGED Viewed

@@ -10,7 +10,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 4096
 sample_packing: false

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 4096
 sample_packing: false

examples/jeopardy-bot/config.yml CHANGED Viewed

@@ -21,7 +21,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./jeopardy-bot-7b
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/jeopardy-bot-7b
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

examples/llama-2/fft_optimized.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/out
 sequence_len: 4096
 sample_packing: true

examples/llama-2/gptq-lora.yml CHANGED Viewed

@@ -33,7 +33,7 @@ wandb_project:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./model-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/model-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

examples/llama-2/lisa.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./lisa-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/lisa-out
 sequence_len: 4096
 sample_packing: true

examples/llama-2/loftq.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/llama-2/lora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/llama-2/qlora-fsdp.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/llama-2/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/llama-2/relora.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./relora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/relora-out
 adapter: qlora
 lora_model_dir:

examples/llama-3/fft-8b.yaml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./out
 sequence_len: 8192
 sample_packing: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/out
 sequence_len: 8192
 sample_packing: true

examples/llama-3/lora-8b.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./lora-out
 sequence_len: 4096
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/lora-out
 sequence_len: 4096
 sample_packing: true

examples/llama-3/qlora-fsdp-70b.yaml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./out/qlora-llama3-70b
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/out/qlora-llama3-70b
 adapter: qlora
 lora_model_dir:

examples/llama-3/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/mamba/config.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
-output_dir: ./out
 sequence_len: 2048
 sample_packing: false

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.0
+output_dir: ./outputs/out
 sequence_len: 2048
 sample_packing: false

examples/mistral/bigstral-ds-zero3.yaml CHANGED Viewed

@@ -23,7 +23,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
-output_dir: ./out
 sequence_len: 2048
 sample_packing: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
+output_dir: ./outputs/out
 sequence_len: 2048
 sample_packing: true

examples/mistral/config.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./out
 sequence_len: 8192
 sample_packing: true

     type: alpaca
 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/out
 sequence_len: 8192
 sample_packing: true

examples/mistral/lora-mps.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0
-output_dir: ./lora-out
 eval_sample_packing: false
 adapter: lora

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0
+output_dir: ./outputs/lora-out
 eval_sample_packing: false
 adapter: lora

examples/mistral/lora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
-output_dir: ./lora-out
 adapter: lora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
+output_dir: ./outputs/lora-out
 adapter: lora
 lora_model_dir:

examples/mistral/mistral-qlora-fsdp.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
-output_dir: ./qlora-out
 model_config:
   output_router_logits: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
+output_dir: ./outputs/qlora-out
 model_config:
   output_router_logits: true

examples/mistral/mistral-qlora-orpo.yml CHANGED Viewed

@@ -16,7 +16,7 @@ datasets:
     type: chat_template.argilla
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
-output_dir: ./mistral-qlora-orpo-out
 adapter: qlora
 lora_model_dir:

     type: chat_template.argilla
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
+output_dir: ./outputs/mistral-qlora-orpo-out
 adapter: qlora
 lora_model_dir:

examples/mistral/mixtral-8x22b-qlora-fsdp.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
-output_dir: ./qlora-out
 model_config:
   output_router_logits: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
+output_dir: ./outputs/qlora-out
 model_config:
   output_router_logits: true

examples/mistral/mixtral-qlora-fsdp.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
-output_dir: ./qlora-out
 model_config:
   output_router_logits: true

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.02
+output_dir: ./outputs/qlora-out
 model_config:
   output_router_logits: true

examples/mistral/mixtral.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
-output_dir: ./qlora-out
 ## You can optionally freeze the entire model and unfreeze a subset of parameters
 unfrozen_parameters:

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.0
+output_dir: ./outputs/qlora-out
 ## You can optionally freeze the entire model and unfreeze a subset of parameters
 unfrozen_parameters:

examples/mistral/mixtral_22.yml CHANGED Viewed

@@ -21,7 +21,7 @@ model_config:
 datasets:
   - path: yahma/alpaca-cleaned
     type: alpaca
-output_dir: ./out
 sequence_len: 8000
 sample_packing: true

 datasets:
   - path: yahma/alpaca-cleaned
     type: alpaca
+output_dir: ./outputs/out
 sequence_len: 8000
 sample_packing: true

examples/mistral/qlora.yml CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
-output_dir: ./qlora-out
 adapter: qlora
 lora_model_dir:

     type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.1
+output_dir: ./outputs/qlora-out
 adapter: qlora
 lora_model_dir:

examples/mpt-7b/config.yml CHANGED Viewed

@@ -23,7 +23,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./mpt-alpaca-7b
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/mpt-alpaca-7b
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

examples/openllama-3b/config.yml CHANGED Viewed

@@ -25,7 +25,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./openllama-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/openllama-out
 gradient_accumulation_steps: 1
 micro_batch_size: 1
 num_epochs: 4

examples/openllama-3b/lora.yml CHANGED Viewed

@@ -31,7 +31,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./lora-out
 gradient_accumulation_steps: 1
 micro_batch_size: 2
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/lora-out
 gradient_accumulation_steps: 1
 micro_batch_size: 2
 num_epochs: 4

examples/openllama-3b/qlora.yml CHANGED Viewed

@@ -25,7 +25,7 @@ wandb_entity:
 wandb_watch:
 wandb_name:
 wandb_log_model:
-output_dir: ./qlora-out
 gradient_accumulation_steps: 1
 micro_batch_size: 2
 num_epochs: 4

 wandb_watch:
 wandb_name:
 wandb_log_model:
+output_dir: ./outputs/qlora-out
 gradient_accumulation_steps: 1
 micro_batch_size: 2
 num_epochs: 4

examples/phi/phi-ft.yml CHANGED Viewed

@@ -12,7 +12,7 @@ datasets:
 dataset_prepared_path:
 val_set_size: 0.05
-output_dir: ./phi-sft-out
 sequence_len: 2048
 sample_packing: true

 dataset_prepared_path:
 val_set_size: 0.05
+output_dir: ./outputs/phi-sft-out
 sequence_len: 2048
 sample_packing: true