pszemraj/pegasus-x-large-book-summary

Get SparkNotes-esque summaries of arbitrary text! Due to the model size, it's recommended to try it out in Colab (linked above) as the API textbox may time out.

This model is a fine-tuned version of google/pegasus-x-large on the kmfoda/booksum dataset for approx eight epochs.

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

Epochs 1-4

TODO

Epochs 5 & 6

The following hyperparameters were used during training:

learning_rate: 6e-05
train_batch_size: 4
eval_batch_size: 1
seed: 42
distributed_type: multi-GPU
gradient_accumulation_steps: 32
total_train_batch_size: 128
optimizer: ADAN using lucidrains' adan-pytorch with default betas
lr_scheduler_type: constant_with_warmup
data type: TF32
num_epochs: 2

Epochs 7 & 8

epochs 5 & 6 were trained with 12288 tokens input
this fixes that with 2 epochs at 16384 tokens input

The following hyperparameters were used during training:

learning_rate: 0.0004
train_batch_size: 4
eval_batch_size: 1
seed: 42
distributed_type: multi-GPU
gradient_accumulation_steps: 16
total_train_batch_size: 64
optimizer: ADAN using lucidrains' adan-pytorch with default betas
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.03
num_epochs: 2

Framework versions

Transformers 4.22.0
Pytorch 1.11.0a0+17540c5
Datasets 2.4.0
Tokenizers 0.12.1

Evaluation results

ROUGE-1 on samsum

test set verified

33.140

ROUGE-2 on samsum

test set verified

9.309

ROUGE-L on samsum

test set verified

24.855

ROUGE-LSUM on samsum

test set verified

29.039

loss on samsum

test set verified

2.288

gen_len on samsum

test set verified

45.217

ROUGE-1 on launch/gov_report

test set verified

39.728

ROUGE-2 on launch/gov_report

test set verified

10.894

ROUGE-L on launch/gov_report

test set verified

19.702

ROUGE-LSUM on launch/gov_report

test set verified

36.563

pszemraj
/

pegasus-x-large-book-summary

pszemraj/pegasus-x-large-book-summary

Training and evaluation data

Training procedure

Training hyperparameters

Epochs 1-4

Epochs 5 & 6

Epochs 7 & 8

Framework versions

Model tree for pszemraj/pegasus-x-large-book-summary

Dataset used to train pszemraj/pegasus-x-large-book-summary

Spaces using pszemraj/pegasus-x-large-book-summary 8

Collection including pszemraj/pegasus-x-large-book-summary

BookSum-based Summarizers

Evaluation results