Training in progress, epoch 19

Browse files

Files changed (6) hide show

model.safetensors +1 -1
wandb/debug-internal.log +0 -0
wandb/run-20240924_172630-x9iddikd/files/output.log +1 -0
wandb/run-20240924_172630-x9iddikd/files/wandb-summary.json +1 -1
wandb/run-20240924_172630-x9iddikd/logs/debug-internal.log +0 -0
wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c10df5156e64e7280f9debd766a0c2759b56fb2a85276465b1b166545a1f53b6
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0f1c2e57ec1b2c872b589767af2b40a21c239a0b8fe0ea83c2fffcf18bf7e77
 size 267832560

wandb/debug-internal.log CHANGED Viewed

The diff for this file is too large to render. See raw diff

wandb/run-20240924_172630-x9iddikd/files/output.log CHANGED Viewed

@@ -52,3 +52,4 @@ You should probably TRAIN this model on a down-stream task to be able to use it
 {'loss': 0.0268, 'grad_norm': 20.58578109741211, 'learning_rate': 6.800000000000001e-06, 'epoch': 16.0}
 {'eval_loss': 0.49775975942611694, 'eval_accuracy': 0.921, 'eval_runtime': 37.3442, 'eval_samples_per_second': 26.778, 'eval_steps_per_second': 0.857, 'epoch': 16.0}
 {'eval_loss': 0.5782524347305298, 'eval_accuracy': 0.909, 'eval_runtime': 38.4136, 'eval_samples_per_second': 26.032, 'eval_steps_per_second': 0.833, 'epoch': 17.0}

 {'loss': 0.0268, 'grad_norm': 20.58578109741211, 'learning_rate': 6.800000000000001e-06, 'epoch': 16.0}
 {'eval_loss': 0.49775975942611694, 'eval_accuracy': 0.921, 'eval_runtime': 37.3442, 'eval_samples_per_second': 26.778, 'eval_steps_per_second': 0.857, 'epoch': 16.0}
 {'eval_loss': 0.5782524347305298, 'eval_accuracy': 0.909, 'eval_runtime': 38.4136, 'eval_samples_per_second': 26.032, 'eval_steps_per_second': 0.833, 'epoch': 17.0}
+{'eval_loss': 0.5907241106033325, 'eval_accuracy': 0.901, 'eval_runtime': 37.9133, 'eval_samples_per_second': 26.376, 'eval_steps_per_second': 0.844, 'epoch': 18.0}

wandb/run-20240924_172630-x9iddikd/files/wandb-summary.json CHANGED Viewed

@@ -1 +1 @@

- {"eval/loss": 0.~~5907241106033325~~, "eval/accuracy": 0.~~901~~, "eval/runtime": 37.~~9133~~, "eval/samples_per_second": 26.~~376~~, "eval/steps_per_second": 0.~~844~~, "train/epoch": 18.0, "train/global_step": ~~2250~~, "_timestamp": ~~1727251130~~.~~273428~~, "_runtime": ~~41539~~.~~400518894196~~, "_step": 29, "train/loss": 0.0268, "train/grad_norm": 20.58578109741211, "train/learning_rate": 6.800000000000001e-06, "train_runtime": 8026.8642, "train_samples_per_second": 2.492, "train_steps_per_second": 0.156, "total_flos": 2396475988298112.0, "train_loss": 0.11480112991333008}

+ {"eval/loss": 0.517770528793335, "eval/accuracy": 0.917, "eval/runtime": 37.8369, "eval/samples_per_second": 26.429, "eval/steps_per_second": 0.846, "train/epoch": 19.0, "train/global_step": 2375, "_timestamp": 1727252836.361977, "_runtime": 43245.48906803131, "_step": 30, "train/loss": 0.0268, "train/grad_norm": 20.58578109741211, "train/learning_rate": 6.800000000000001e-06, "train_runtime": 8026.8642, "train_samples_per_second": 2.492, "train_steps_per_second": 0.156, "total_flos": 2396475988298112.0, "train_loss": 0.11480112991333008}

wandb/run-20240924_172630-x9iddikd/logs/debug-internal.log CHANGED Viewed

The diff for this file is too large to render. See raw diff

wandb/run-20240924_172630-x9iddikd/run-x9iddikd.wandb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de200d9d3e577801e7bb4a6254575c3af420f0fd8e03000b80554a1dcedd2ac3
-size 1138650

 version https://git-lfs.github.com/spec/v1
+oid sha256:225a3466e1f5f63a52cc6e45441bc6533dc9c05caad936ff1a32ff85d9e80380
+size 1184325