jos1M v1.2
This action may take several minutes for large corpora, please wait.

jos1M v1.2

Delno ročno označeni korpus jos1M v1.2 (oblikoskladnja) // Slovene partially manually annotated corpus jos1M v1.2 (morphosyntax)

Counts
Tokens1182814
Words976460
Sentences60277
Paragraphs15757
Documents2564
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled02/11/2019 17:58:39
Tagset Description
Lexicon sizes
word143963
lempos 65181
ud_mor 1492
tag_en 1412
tag 1412
id 1182814
lc 122947
norm 122947
lemma63408
lemma_lc 61443
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u

Structures and attributes