Spico
/

mirror-chinese-mrcqa-alpha

Spico commited on Dec 4, 2023

Commit

5968071

1 Parent(s): b3e11d2

init

Files changed (2) hide show

ckpt/MrcGlobalPointerModel.best.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9b75816657a9b40ee8c2a6a1073f320e30f068998a05a5c9a267c42bead1e3f
+size 414414660

task_params.yaml ADDED Viewed

+_config_info:
+  create_time: '2023-03-14 23:35:21'
+  use_default_base_config: true
+  config_filepath:
+  - /data/tzhu/MRC4IE/conf/mrc.yaml
+task_type: MrcQaTask
+task_name: RobertaBase_data20230314v2
+comment: GlobalPointer with RoPE
+output_dir: outputs
+task_dir: outputs/RobertaBase_data20230314v2
+dump_cache_dir: outputs/RobertaBase_data20230314v2/cache
+regenerate_cache: true
+data_dir: resources/Merged/20230314-v2
+train_filepath: resources/Merged/20230314-v2/train.jsonl
+dev_filepath: resources/Merged/20230314-v2/dev.jsonl
+test_filepath: resources/Merged/20230314-v2/test.jsonl
+random_seed: 1227
+num_epochs: 20
+num_steps: -1
+warmup_proportion: 0.1
+epoch_patience: 10
+step_patience: 5000
+batch_size: 64
+learning_rate: 2.0e-05
+max_grad_norm: -1.0
+skip_train: false
+debug_mode: false
+grad_accum_steps: 1
+resumed_training_path: null
+step_eval_interval: 20000
+epoch_eval_interval: 1
+eval_on_data:
+- dev
+select_best_on_data: dev
+select_best_by_key: metric
+best_metric_field: micro.f1
+save_every_ckpt: false
+save_best_ckpt: true
+final_eval_on_test: true
+main_process_logging: true
+max_seq_len: 512
+plm_dir: hfl/chinese-roberta-wwm-ext
+train_batch_size: 16
+eval_batch_size: 32
+other_learning_rate: 2.0e-05
+dropout: 0.3
+biaffine_size: 512
+include_package:
+- src.task
+use_default_base_config: true