Graphcore
/

groupbert-base-uncased

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Ivan Chelombiev commited on Nov 25, 2022

Commit

bf20149

•

1 Parent(s): cb0616e

update model card README.md

Files changed (1) hide show

README.md +4 -5

README.md CHANGED Viewed

@@ -1,8 +1,6 @@
 ---
 tags:
 - generated_from_trainer
-datasets:
-- Graphcore/wikipedia-bert-512
 model-index:
 - name: output-pretrain-groupbert-base-phase2
   results: []
@@ -13,7 +11,7 @@ should probably proofread and complete it, then remove this comment. -->
 # output-pretrain-groupbert-base-phase2
-This model was trained from scratch on the Graphcore/wikipedia-bert-512 dataset.
 ## Model description
@@ -42,7 +40,8 @@ The following hyperparameters were used during training:
 - total_eval_batch_size: 20
 - optimizer: LAMB
 - lr_scheduler_type: linear
-- training_steps: 1
 - training precision: Mixed Precision
 ### Training results
@@ -53,5 +52,5 @@ The following hyperparameters were used during training:
 - Transformers 4.20.1
 - Pytorch 1.10.0+cpu
-- Datasets 2.2.2
 - Tokenizers 0.12.1

 ---
 tags:
 - generated_from_trainer
 model-index:
 - name: output-pretrain-groupbert-base-phase2
   results: []
 # output-pretrain-groupbert-base-phase2
+This model was trained from scratch on the None dataset.
 ## Model description
 - total_eval_batch_size: 20
 - optimizer: LAMB
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.15
+- training_steps: 2038
 - training precision: Mixed Precision
 ### Training results
 - Transformers 4.20.1
 - Pytorch 1.10.0+cpu
+- Datasets 2.6.1
 - Tokenizers 0.12.1