Gigafida v2.0 DeDup (referenčni, dedupliciran)
This action may take several minutes for large corpora, please wait.

Gigafida v2.0 DeDup (referenčni, dedupliciran)

Slovenski referenčni korpus Gigafida, v2.0 (1990-2018), brez bližnjih duplikatov // Slovene reference corpus Gigafida, v2.0 (1990-2018) without near duplicates.

Counts
Tokens1333360653
Words1109441592
Sentences59861870
Paragraphs15208804
Documents38310
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled12/29/2018 22:46:47
Tagset Description
Lexicon sizes
word5051312
lempos3925246
tag_en1338
tag1342
lc 4221191
lemma3547617
lemma_lc3158022
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u

Structures and attributes