slWaC (Slovene Web)
This action may take several minutes for large corpora, please wait.

slWaC (Slovene Web)

Korpus slovenskega spleta slWaC v2.1 (2014) // Slovene Web Corpus slWaC v2.1 (2014)

Counts
Tokens895903321
Words754255589
Sentences50847258
Paragraphs16653958
Documents2823701
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled10/28/2017 20:42:25
Tagset Description
Lexicon sizes
word
norm
lempos
tag_en
tag
lc
lemma
lemma_lc
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u