Update README.md
Browse files
README.md
CHANGED
@@ -22,7 +22,7 @@ DeFormer har tränats på meningar från Europarlamentet och svenskspråkiga Wik
|
|
22 |
|
23 |
Endast meningar innehållandes `de`, `dem`, `det`, `enda` eller `ända` behölls i konstruktionen av träningsdataset. I tabellen nedan återfinns beskrivande statistik över antalet meningar som behölls från respektive dataset, samt frekvenser över förekomster av respektive ord.
|
24 |
|
25 |
-
| Datakälla | Meningar | # De | # Dem | # Det | # Enda | # Ända |
|
26 |
| ----------- | ----------- | ----------- | ----------- | -------------|---------- | --------- |
|
27 |
| [Europaparl sv.txt.gz](https://opus.nlpl.eu/download.php?f=Europarl/v8/mono/sv.txt.gz) | 1150556 | 461305 | 53726 | 824065 | 15553 | 1781 |
|
28 |
| [JRC-Acquis raw.sv.gz](https://opus.nlpl.eu/download.php?f=JRC-Acquis/mono/JRC-Acquis.raw.sv.gz) | 648387 | 399628 | 16539 | 326925 | 5975 | 267 |
|
|
|
22 |
|
23 |
Endast meningar innehållandes `de`, `dem`, `det`, `enda` eller `ända` behölls i konstruktionen av träningsdataset. I tabellen nedan återfinns beskrivande statistik över antalet meningar som behölls från respektive dataset, samt frekvenser över förekomster av respektive ord.
|
24 |
|
25 |
+
| Datakälla | Meningar/dokument | # De | # Dem | # Det | # Enda | # Ända |
|
26 |
| ----------- | ----------- | ----------- | ----------- | -------------|---------- | --------- |
|
27 |
| [Europaparl sv.txt.gz](https://opus.nlpl.eu/download.php?f=Europarl/v8/mono/sv.txt.gz) | 1150556 | 461305 | 53726 | 824065 | 15553 | 1781 |
|
28 |
| [JRC-Acquis raw.sv.gz](https://opus.nlpl.eu/download.php?f=JRC-Acquis/mono/JRC-Acquis.raw.sv.gz) | 648387 | 399628 | 16539 | 326925 | 5975 | 267 |
|