ssj500k v2.2
This action may take several minutes for large corpora, please wait.

ssj500k v2.2

Ročno označeni korpus ssj500k v2.2 (oblikoskladnja, skladnja, imenske entitete, glagolske večbesedne enote, udeleženske vloge) // Slovene manually annotated corpus ssj500k v2.2 (morphosyntax, syntax, named entities, verbal multiword expressions, semantic roles)

Counts
Tokens586248
Words492385
Sentences27829
Paragraphs8137
Documents1655
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled01/26/2019 18:17:14
Tagset Description
Lexicon sizes
word86919
lempos 39045
tag_en 1304
tag 1304
id 586248
dep_en 11
dep 11
dep_head_lemma 15029
dep_head_tag_en 709
dep_head_tag 709
dep_head_id 82427
mwe_type 13
mwe_words 1760
mwe_lemmas 1077
lc 78707
norm 78707
lemma38818
lemma_lc 38151
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u

Structures and attributes