Gigafida v1.1 DeDup (referenčni, dedupliciran)
This action may take several minutes for large corpora, please wait.

Gigafida v1.1 DeDup (referenčni, dedupliciran)

Slovenski referenčni korpus Gigafida, v1.1 (1990-2011), brez (bližnjih) duplikatov // Slovene reference corpus Gigafida, v1.1 (1990-2011) without (near) duplicates.

Counts
Tokens1111927975
Words922808492
Sentences50312209
Paragraphs13051842
Documents36981
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled10/29/2017 20:41:53
Tagset Description
Lexicon sizes
word
lempos
tag_en
tag
lc
norm
lemma
lemma_lc
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u