Sven00
/

redpj7B-lora-cnn-dailymail_2870_samples

Model card Files Files and versions Community

Sven00 commited on Aug 16, 2023

Commit

f1be7a6

•

1 Parent(s): b5a2f9f

Upload 14 files

Browse files

Files changed (14) hide show

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/adapter_config.json +16 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/adapter_model.bin +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/optimizer.pt +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/rng_state.pth +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/scheduler.pt +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/trainer_state.json +84 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/training_args.bin +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/adapter_config.json +16 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/adapter_model.bin +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/optimizer.pt +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/rng_state.pth +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/scheduler.pt +3 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/trainer_state.json +152 -0
redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/training_args.bin +3 -0

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/adapter_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "base_model_name_or_path": "/domino/edv/afs-mrmc-data-store-rw/innovation/hf/RedPajama-INCITE-7B-Base",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b47162c9c1217e296a97387e5e0eb5ed2df80aab1b6860fb83c03b0523e15cad
+size 16800753

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9d009bbc725e80e03b7d0537b3c681e631dea889a4c2d98df3fcac73b9ec3c1
+size 33592261

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:56a3a34d8b7f1d6505270f74d6050bb998ab2c3c2d5999a4ddc0f07dbd04f62f
+size 14575

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24cd1b551d8302b040b159cd8f0235934a4a57ad1f8c440a889eb87a9abfb8fe
+size 627

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,84 @@

+{
+  "best_metric": 1.8871846199035645,
+  "best_model_checkpoint": "/domino/edv/afs-mrmc-data-store-rw/innovation/hf/redpj7B-lora-cnn-dailymail-results_10/checkpoint-200",
+  "epoch": 1.3888888888888888,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.0,
+      "loss": 1.8996,
+      "step": 20
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.0,
+      "loss": 1.8773,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.0,
+      "loss": 1.8595,
+      "step": 60
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0,
+      "loss": 1.8621,
+      "step": 80
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 0.0,
+      "loss": 1.8206,
+      "step": 100
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.0,
+      "loss": 1.8477,
+      "step": 120
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.0,
+      "loss": 1.9184,
+      "step": 140
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 0.0,
+      "loss": 1.891,
+      "step": 160
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 0.0,
+      "loss": 1.8885,
+      "step": 180
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 0.0,
+      "loss": 1.8674,
+      "step": 200
+    },
+    {
+      "epoch": 1.39,
+      "eval_loss": 1.8871846199035645,
+      "eval_runtime": 12064.3322,
+      "eval_samples_per_second": 1.108,
+      "eval_steps_per_second": 0.139,
+      "step": 200
+    }
+  ],
+  "max_steps": 432,
+  "num_train_epochs": 3,
+  "total_flos": 1.2442809896681472e+16,
+  "trial_name": null,
+  "trial_params": null
+}

redpj7B-lora-cnn-dailymail-results_10/checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9ce8a29df62c824cf1f148326751b1e02fff8468386faf591f14dde44872f0e
+size 4091

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/adapter_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "base_model_name_or_path": "/domino/edv/afs-mrmc-data-store-rw/innovation/hf/RedPajama-INCITE-7B-Base",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b47162c9c1217e296a97387e5e0eb5ed2df80aab1b6860fb83c03b0523e15cad
+size 16800753

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95f1b2d8af7f3a70cd816a8981e7b02351044a820b84505113ced8f6cc2bd63b
+size 33592261

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a857782c970b0078facb7d84667df22e146e80669c1719c902157213fb1b85fb
+size 14575

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bba29cc1c2f22d2c1b6368568e7c8561705461a5ae66a0a29aec90d4426b3d7e
+size 627

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/trainer_state.json ADDED Viewed

	@@ -0,0 +1,152 @@

+{
+  "best_metric": 1.8871846199035645,
+  "best_model_checkpoint": "/domino/edv/afs-mrmc-data-store-rw/innovation/hf/redpj7B-lora-cnn-dailymail-results_10/checkpoint-200",
+  "epoch": 2.7777777777777777,
+  "global_step": 400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.0,
+      "loss": 1.8996,
+      "step": 20
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.0,
+      "loss": 1.8773,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.0,
+      "loss": 1.8595,
+      "step": 60
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0,
+      "loss": 1.8621,
+      "step": 80
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 0.0,
+      "loss": 1.8206,
+      "step": 100
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.0,
+      "loss": 1.8477,
+      "step": 120
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.0,
+      "loss": 1.9184,
+      "step": 140
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 0.0,
+      "loss": 1.891,
+      "step": 160
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 0.0,
+      "loss": 1.8885,
+      "step": 180
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 0.0,
+      "loss": 1.8674,
+      "step": 200
+    },
+    {
+      "epoch": 1.39,
+      "eval_loss": 1.8871846199035645,
+      "eval_runtime": 12064.3322,
+      "eval_samples_per_second": 1.108,
+      "eval_steps_per_second": 0.139,
+      "step": 200
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 0.0,
+      "loss": 1.8998,
+      "step": 220
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 0.0,
+      "loss": 1.8504,
+      "step": 240
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 0.0,
+      "loss": 1.8554,
+      "step": 260
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 0.0,
+      "loss": 1.8329,
+      "step": 280
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.0,
+      "loss": 1.8951,
+      "step": 300
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 0.0,
+      "loss": 1.8877,
+      "step": 320
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 0.0,
+      "loss": 1.8668,
+      "step": 340
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 0.0,
+      "loss": 1.855,
+      "step": 360
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 0.0,
+      "loss": 1.8598,
+      "step": 380
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 0.0,
+      "loss": 1.8242,
+      "step": 400
+    },
+    {
+      "epoch": 2.78,
+      "eval_loss": 1.8871846199035645,
+      "eval_runtime": 12065.8831,
+      "eval_samples_per_second": 1.108,
+      "eval_steps_per_second": 0.138,
+      "step": 400
+    }
+  ],
+  "max_steps": 432,
+  "num_train_epochs": 3,
+  "total_flos": 2.4885619793362944e+16,
+  "trial_name": null,
+  "trial_params": null
+}

redpj7B-lora-cnn-dailymail-results_10/checkpoint-400/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9ce8a29df62c824cf1f148326751b1e02fff8468386faf591f14dde44872f0e
+size 4091