Nekochu
/

Luminia-8B-RP

Not-For-All-Audiences

nsfw

Model card Files Files and versions Community

Nekochu commited on Sep 13

Commit

c3d32f7

•

1 Parent(s): 4099822

Update README.md

Files changed (1) hide show

README.md +37 -3

README.md CHANGED Viewed

@@ -1,3 +1,37 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+---
+license: apache-2.0
+base_model: NousResearch/Meta-Llama-3.1-8B-Instruct
+library_name: peft
+tags:
+- llama-factory
+- lora
+datasets:
+  - Nekochu/Luminia-mixture
+language:
+  - en
+---
+- Fine-tuning of ‘Llama-3.1-8B’ with a focus on RP and uncensored.
+<details>
+  <summary>This training can be replicated using LLaMA-Factory. </summary>
+Stage A: Continued **S**upervised **F**ine-**T**uning, QA
+```
+set CUDA_VISIBLE_DEVICES=0 &&  llamafactory-cli train --stage sft --do_train True --model_name_or_path NousResearch/Meta-Llama-3.1-8B-Instruct --preprocessing_num_workers 1 --finetuning_type lora --template alpaca --rope_scaling linear --flash_attn fa2 --dataset_dir data --dataset faproulette_co-OCR-fix-gpt4o_qa,ascii_art,Uncensored_DAN,Lumimaid-v2,Degrees_of_Lewdity --cutoff_len 8192 --learning_rate 5e-05 --num_train_epochs 1.0 --max_samples 100000 --per_device_train_batch_size 1 --gradient_accumulation_steps 1 --lr_scheduler_type cosine --max_grad_norm 1.0 --logging_steps 10 --save_steps 1000 --warmup_steps 1000 --neftune_noise_alpha 5 --optim adamw_8bit --packing True --neat_packing True --report_to none --output_dir saves\LLaMA3.1-8B-Chat\lora\Luminia-8B-RP --bf16 True --plot_loss True --ddp_timeout 180000000 --include_num_input_tokens_seen True --quantization_bit 4 --quantization_method bitsandbytes --lora_rank 32 --lora_alpha 64 --lora_dropout 0.15 --create_new_adapter True --lora_target all --use_adam_mini True
+```
+<details>
+  <summary>dataset_info.json</summary>
+`dataset_info.json`:
+```json
+...
+```
+</details>
+</details>