IlyaGusev
/

mbart_ru_sum_gazeta

text2text-generation

Inference Endpoints

Model card Files Files and versions Community

IlyaGusev commited on Nov 25, 2021

Commit

5df2e50

•

1 Parent(s): 599d3c6

Update README.md

Files changed (1) hide show

README.md +12 -12

README.md CHANGED Viewed

@@ -51,7 +51,7 @@ input_ids = tokenizer(
 output_ids = model.generate(
     input_ids=input_ids,
-    no_repeat_ngram_size=3
 )[0]
 summary = tokenizer.decode(output_ids, skip_special_tokens=True)
@@ -78,26 +78,26 @@ print(summary)
 * Test dataset: **Gazeta v1 test**
 * Source max_length: **600**
 * Target max_length: **200**
-* no_repeat_ngram_size: **3**
 * num_beams: **5**
-| Model                     | R-1-f | R-2-f | R-L-f | chrF | METEOR | BLEU |
-|:--------------------------|:------|:------|:------|:-------|:-------|:-----|
-| [mbart_ru_sum_gazeta](https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta)       | **32.3**  | 14.3  | **27.9**  | **39.8** | **26.3**   | **12.2** |
-| [rut5_base_sum_gazeta](https://huggingface.co/IlyaGusev/rut5_base_sum_gazeta)      | 32.2  | **14.4**  | 27.8 | 39.6 | 25.3   | 11.9 |
 * Train dataset: **Gazeta v1 train**
 * Test dataset: **Gazeta v2 test**
 * Source max_length: **600**
 * Target max_length: **200**
-* no_repeat_ngram_size: **3**
 * num_beams: **5**
-| Model                     | R-1-f | R-2-f | R-L-f | chrF | METEOR | BLEU |
-|:--------------------------|:------|:------|:------|:-------|:-------|:-----|
-| [mbart_ru_sum_gazeta](https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta)        | **28.8**  | **11.1**  | **24.5**  | **37.4** | **22.7**   | **9.5** |
-| [rut5_base_sum_gazeta](https://huggingface.co/IlyaGusev/rut5_base_sum_gazeta)      | 28.5  | 11.0  | 24.2  | 36.8 | 21.2   | 8.6 |
 Predicting all summaries:
 ```python

 output_ids = model.generate(
     input_ids=input_ids,
+    no_repeat_ngram_size=4
 )[0]
 summary = tokenizer.decode(output_ids, skip_special_tokens=True)
 * Test dataset: **Gazeta v1 test**
 * Source max_length: **600**
 * Target max_length: **200**
+* no_repeat_ngram_size: **4**
 * num_beams: **5**
+| Model                     | R-1-f | R-2-f | R-L-f | chrF | METEOR | BLEU | Avg char length |
+|:--------------------------|:------|:------|:------|:-------|:-------|:-----|:-----|
+| [mbart_ru_sum_gazeta](https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta)       | **32.4**  | 14.3  | 28.0  | 39.7 | **26.4** | 12.1 | 371 |
+| [rut5_base_sum_gazeta](https://huggingface.co/IlyaGusev/rut5_base_sum_gazeta)      | 32.2  | **14.4**  | **28.1** | **39.8** | 25.7 | **12.3** | 330 |
+ |
 * Train dataset: **Gazeta v1 train**
 * Test dataset: **Gazeta v2 test**
 * Source max_length: **600**
 * Target max_length: **200**
+* no_repeat_ngram_size: **4**
 * num_beams: **5**
+| Model                     | R-1-f | R-2-f | R-L-f | chrF | METEOR | BLEU | Avg char length |
+|:--------------------------|:------|:------|:------|:-------|:-------|:-----|:-----|
+| [mbart_ru_sum_gazeta](https://huggingface.co/IlyaGusev/mbart_ru_sum_gazeta)        | **28.7**  | **11.1**  | **24.4**  | **37.3** | **22.7**  | **9.4** | 373 |
+| [rut5_base_sum_gazeta](https://huggingface.co/IlyaGusev/rut5_base_sum_gazeta)      | 28.6 | 11.1 | **24.5** | 37.2 | 22.0 | 9.4 | 331 |
 Predicting all summaries:
 ```python