Saving weights and logs of epoch 6

Browse files

Files changed (17) hide show

.run_translation_t5_flax.py.swp +0 -0
config.json +3 -0
events.out.tfevents.1625766202.t1v-n-55481057-w-0.41473.3.v2 +0 -0
events.out.tfevents.1625766661.t1v-n-55481057-w-0.42918.3.v2 +0 -0
events.out.tfevents.1625767718.t1v-n-55481057-w-0.44369.3.v2 +0 -0
events.out.tfevents.1625767744.t1v-n-55481057-w-0.45667.3.v2 +0 -0
events.out.tfevents.1625768139.t1v-n-55481057-w-0.47104.3.v2 +0 -0
events.out.tfevents.1625768463.t1v-n-55481057-w-0.48556.3.v2 +0 -0
events.out.tfevents.1625769058.t1v-n-55481057-w-0.50006.3.v2 +0 -0
events.out.tfevents.1625769345.t1v-n-55481057-w-0.51489.3.v2 +0 -0
events.out.tfevents.1625769791.t1v-n-55481057-w-0.52973.3.v2 +0 -0
events.out.tfevents.1625770347.t1v-n-55481057-w-0.54460.3.v2 +0 -0
events.out.tfevents.1625770589.t1v-n-55481057-w-0.55856.3.v2 +0 -0
events.out.tfevents.1625770862.t1v-n-55481057-w-0.57252.3.v2 +0 -0
events.out.tfevents.1625771104.t1v-n-55481057-w-0.58650.3.v2 +0 -0
flax_model.msgpack +3 -0
run_translation_t5_flax.py +18 -8

.run_translation_t5_flax.py.swp ADDED Viewed

Binary file (57.3 kB). View file

config.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:67ab6b43f4bacd25ccb5e78e065aa2c118535865f9621645b9f0caad1249e47c
+size 1360

events.out.tfevents.1625766202.t1v-n-55481057-w-0.41473.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625766661.t1v-n-55481057-w-0.42918.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625767718.t1v-n-55481057-w-0.44369.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625767744.t1v-n-55481057-w-0.45667.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625768139.t1v-n-55481057-w-0.47104.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625768463.t1v-n-55481057-w-0.48556.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625769058.t1v-n-55481057-w-0.50006.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625769345.t1v-n-55481057-w-0.51489.3.v2 ADDED Viewed

Binary file (32 kB). View file

events.out.tfevents.1625769791.t1v-n-55481057-w-0.52973.3.v2 ADDED Viewed

Binary file (32 kB). View file

events.out.tfevents.1625770347.t1v-n-55481057-w-0.54460.3.v2 ADDED Viewed

Binary file (31.9 kB). View file

events.out.tfevents.1625770589.t1v-n-55481057-w-0.55856.3.v2 ADDED Viewed

Binary file (40 Bytes). View file

events.out.tfevents.1625770862.t1v-n-55481057-w-0.57252.3.v2 ADDED Viewed

Binary file (31.9 kB). View file

events.out.tfevents.1625771104.t1v-n-55481057-w-0.58650.3.v2 ADDED Viewed

Binary file (176 kB). View file

flax_model.msgpack ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69324e2320f6e0c2619bce081b9a703fb4f3dadd403c7b960875a5a8c61d1f39
+size 241981002

run_translation_t5_flax.py CHANGED Viewed

@@ -260,8 +260,10 @@ def write_metric(summary_writer, train_metrics, eval_metrics, train_time, step):
         for i, val in enumerate(vals):
             summary_writer.scalar(tag, val, step - len(vals) + i + 1)
     for metric_name, value in eval_metrics.items():
-        summary_writer.scalar(f"eval_{metric_name}", value, step)
 def create_learning_rate_fn(
@@ -499,7 +501,7 @@ def main():
         )
     # Metric
-    metric = load_metric("bleu")
     def postprocess_text(preds, labels):
         preds = [pred.strip() for pred in preds]
@@ -519,14 +521,22 @@ def main():
         #Probably not needed for bleu - pere
         #decoded_preds, decoded_labels = postprocess_text(decoded_preds, decoded_labels)
-        breakpoint()
-        result = metric.compute(predictions=decoded_preds, references=decoded_labels)
         # Extract a few results from ROUGE
-        result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
-        prediction_lens = [np.count_nonzero(pred != tokenizer.pad_token_id) for pred in preds]
-        result["gen_len"] = np.mean(prediction_lens)
-        result = {k: round(v, 4) for k, v in result.items()}
         return result
     # Enable tensorboard only on the master node

         for i, val in enumerate(vals):
             summary_writer.scalar(tag, val, step - len(vals) + i + 1)
+    #Pere - dropping all values that are not float
     for metric_name, value in eval_metrics.items():
+        if isinstance(value,float):
+            summary_writer.scalar(f"eval_{metric_name}", value, step)
 def create_learning_rate_fn(
         )
     # Metric
+    metric = load_metric("sacrebleu")
     def postprocess_text(preds, labels):
         preds = [pred.strip() for pred in preds]
         #Probably not needed for bleu - pere
         #decoded_preds, decoded_labels = postprocess_text(decoded_preds, decoded_labels)
+        #breakpoint()
+        #result = metric.compute(predictions=decoded_preds, references=decoded_labels)
+        decoded_labels_list = [[d] for d in decoded_labels]
+        result = metric.compute(predictions=decoded_preds, references=decoded_labels_list)
+        #Debug stuff - pere
+        print("Example translations")
+        for i in range(0,5):
+            print(f'{decoded_preds[i]} - {decoded_labels_list[i]}')
+        #breakpoint()
         # Extract a few results from ROUGE
+        #result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+        #prediction_lens = [np.count_nonzero(pred != tokenizer.pad_token_id) for pred in preds]
+        #result["gen_len"] = np.mean(prediction_lens)
+        #result = {k: round(v, 4) for k, v in result.items()}
         return result
     # Enable tensorboard only on the master node