liho00
/

omega-a2a-h4

liho00 commited on Jul 30

Commit

78390e6

•

1 Parent(s): 7dfcf86

Upload training_config.yml with huggingface_hub

Files changed (1) hide show

training_config.yml CHANGED Viewed

@@ -25,8 +25,8 @@ resume_from_checkpoint: false
 interim_checkpoint_steps: 5000
 interim_gen_steps: null
 max_new_tokens: 100
-temperature: 0.6
-top_k: 300
 dataset:
   _component_: ds.EvenBatcher
   buffer_size: 36
@@ -46,7 +46,7 @@ dataset:
       train_on_input: false
 seed: null
 shuffle: true
-batch_size: 4
 optimizer:
   _component_: torch.optim.AdamW
   weight_decay: 0.01
@@ -77,8 +77,8 @@ inference:
     {video}
     Caption the previous video.'
-  max_new_tokens: 300
-  temperature: 0.6
-  top_k: 300
   quantizer: null
 gradient-accumulation-steps: 32

 interim_checkpoint_steps: 5000
 interim_gen_steps: null
 max_new_tokens: 100
+temperature: 0.8
+top_k: 333
 dataset:
   _component_: ds.EvenBatcher
   buffer_size: 36
       train_on_input: false
 seed: null
 shuffle: true
+batch_size: 6
 optimizer:
   _component_: torch.optim.AdamW
   weight_decay: 0.01
     {video}
     Caption the previous video.'
+  max_new_tokens: 333
+  temperature: 0.8
+  top_k: 333
   quantizer: null
 gradient-accumulation-steps: 32